Ανάλυση (διαχωρισμός) μιας συμβολοσειράς σε C++ χρησιμοποιώντας διαχωριστικό συμβολοσειράς (τυπική C++)

Question

Περισσότερα

Ερώτηση

Ανάλυση (διαχωρισμός) μιας συμβολοσειράς σε C++ χρησιμοποιώντας διαχωριστικό συμβολοσειράς (τυπική C++)

Αναλύω ένα αλφαριθμητικό σε C++ χρησιμοποιώντας τα ακόλουθα:

string parsed,input="text to be parsed";
stringstream input_stringstream(input);

if(getline(input_stringstream,parsed,' '))
{
     // do some processing.
}

Η ανάλυση με ένα μόνο διαχωριστικό char είναι μια χαρά. Τι γίνεται όμως αν θέλω να χρησιμοποιήσω ένα αλφαριθμητικό ως διαχωριστικό.

Παράδειγμα: Θέλω να χωρίσω:

scott>=tiger

με >= ως διαχωριστικό, ώστε να μπορώ να πάρω τα scott και tiger.

Lightness Races with Monica

Επεξεργασμένη ερώτηση Κάνε Μάιος 2018 в 9:59

Προγραμματισμός

c++

parsing

split

Δημοφιλή βίντεο

« Προηγούμενο

Επόμενο »

Λύση / Απάντηση

496

0

ryanbwork

Κάνε Ιανουάριος 2013 в 7:18

Περισσότερα

strtok σας επιτρέπει να περάσετε πολλαπλά σύμβολα ως διαχωριστικά. Πάω στοίχημα ότι αν περνούσατε το ">=" η συμβολοσειρά του παραδείγματός σας θα χωριζόταν σωστά (παρόλο που τα > και = υπολογίζονται ως μεμονωμένα διαχωριστικά).

EDIT αν δεν θέλετε να χρησιμοποιήσετε την c_str() για να μετατρέψετε από συμβολοσειρά σε char*, μπορείτε να χρησιμοποιήσετε τα substr και find_first_of tokenize.

string token, mystring("scott>=tiger");
while(token != mystring){
  token = mystring.substr(0,mystring.find_first_of(">="));
  mystring = mystring.substr(mystring.find_first_of(">=") + 1);
  printf("%s ",token.c_str());
}

ryanbwork

Επεξεργασμένη απάντηση Κάνε Ιανουάριος 2013 в 7:49

15

0

Benjamin Lindley

Κάνε Ιανουάριος 2013 в 7:40

Περισσότερα

Θα χρησιμοποιούσα το boost::tokenizer. Εδώ'είναι η τεκμηρίωση που εξηγεί πώς να φτιάξετε μια κατάλληλη συνάρτηση tokenizer: http://www.boost.org/doc/libs/1_52_0/libs/tokenizer/tokenizerfunction.htm

Εδώ'είναι μία που λειτουργεί για την περίπτωσή σας.

struct my_tokenizer_func
{
    template<typename It>
    bool operator()(It& next, It end, std::string & tok)
    {
        if (next == end)
            return false;
        char const * del = ">=";
        auto pos = std::search(next, end, del, del + 2);
        tok.assign(next, pos);
        next = pos;
        if (next != end)
            std::advance(next, 2);
        return true;
    }

    void reset() {}
};

int main()
{
    std::string to_be_parsed = "1) one>=2) two>=3) three>=4) four";
    for (auto i : boost::tokenizer<my_tokenizer_func>(to_be_parsed))
        std::cout << i << '\n';
}

3

0

Προσθήκη ερώτησης

Κατηγορίες

Όλα

Τεχνολογία

Πολιτισμός / Αναψυχή

Ζωή / Τέχνες

Επιστήμη

Επαγγελματικό

Επιχείρηση

Χρήστες

Όλα

Νέα

Δημοφιλές

1

Ксения Комарова

Εγγεγραμμένη πριν 1 μήνας

2

Артур «Апер»

Εγγεγραμμένη πριν 2 μήνες

3

Viktor Malyutin

Εγγεγραμμένη πριν 2 μήνες

4

Viktor Malyutin

Εγγεγραμμένη πριν 2 μήνες

5

Syahputra Zhedenk

Εγγεγραμμένη πριν 3 μήνες

Do you have a question? Add it on the site and get an answer instantly

en.kzen.dev

Vincenzo Pii · Accepted Answer · 2013-01-10T19:53:17+00:00

Μπορείτε να χρησιμοποιήσετε τη συνάρτηση std::string::find() για να βρείτε τη θέση του διαχωριστή της συμβολοσειράς σας και στη συνέχεια να χρησιμοποιήσετε τη συνάρτηση std::string::substr() για να λάβετε ένα token.

Παράδειγμα:

std::string s = "scott>=tiger";
std::string delimiter = ">=";
std::string token = s.substr(0, s.find(delimiter)); // token is "scott"

Η συνάρτηση find(const string& str, size_t pos = 0) επιστρέφει τη θέση της πρώτης εμφάνισης του str στο αλφαριθμητικό, ή npos αν το αλφαριθμητικό δεν έχει βρεθεί.
Η συνάρτηση substr(size_t pos = 0, size_t n = npos) επιστρέφει μια υποσειρά του αντικειμένου, ξεκινώντας από τη θέση pos και μήκους npos.

Αν έχετε πολλαπλούς διαχωριστές, αφού εξαγάγετε ένα σύμβολο, μπορείτε να το αφαιρέσετε (συμπεριλαμβανομένου του διαχωριστή) για να συνεχίσετε με τις επόμενες εξαγωγές (αν θέλετε να διατηρήσετε την αρχική συμβολοσειρά, απλά χρησιμοποιήστε s = s.substr(pos + delimiter.length());):

s.erase(0, s.find(delimiter) + delimiter.length());

Με αυτόν τον τρόπο μπορείτε εύκολα να κάνετε βρόχο για να πάρετε κάθε συμβολικό στοιχείο.

Πλήρες παράδειγμα

std::string s = "scott>=tiger>=mushroom";
std::string delimiter = ">=";

size_t pos = 0;
std::string token;
while ((pos = s.find(delimiter)) != std::string::npos) {
    token = s.substr(0, pos);
    std::cout << token << std::endl;
    s.erase(0, pos + delimiter.length());
}
std::cout << s << std::endl;