Je dois charger et utiliser les données de fichier CSV en C++. À ce stade, il peut s'agir simplement d'un analyseur syntaxique délimité par des virgules (par exemple, ne vous inquiétez pas si vous échappez de nouvelles lignes et virgules). Le principal besoin est un analyseur ligne par ligne qui renvoie un vecteur pour la ligne suivante chaque fois que la méthode est appelée.
J'ai trouvé cet article qui semble assez prometteur:
Je n'ai jamais utilisé l'esprit de Boost, mais je suis prêt à l'essayer. Mais c'est seulement s'il n'y a pas une solution plus simple que je néglige.
Si vous ne vous souciez pas d'échapper à la virgule et à la nouvelle ligne,
ET__. ET vous ne pouvez pas insérer de virgule et de nouvelle ligne entre guillemets (Si vous ne pouvez pas vous échapper, alors ...)
alors il ne s’agit que de trois lignes de code (OK 14 -> mais il n’ya que 15 lignes pour lire le fichier en entier).
std::vector<std::string> getNextLineAndSplitIntoTokens(std::istream& str)
std::vector<std::string> result;
std::string line;
std::stringstream lineStream(line);
std::string cell;
while(std::getline(lineStream,cell, ','))
// This checks for a trailing comma with no data after it.
if (!lineStream && cell.empty())
// If there was a trailing comma then add an empty element.
return result;
Je créerais simplement une classe représentant une ligne.
Ensuite, diffusez dans cet objet:
#include <iterator>
#include <iostream>
#include <fstream>
#include <sstream>
#include <vector>
#include <string>
class CSVRow
std::string const& operator[](std::size_t index) const
return m_data[index];
std::size_t size() const
return m_data.size();
void readNextRow(std::istream& str)
std::string line;
std::getline(str, line);
std::stringstream lineStream(line);
std::string cell;
while(std::getline(lineStream, cell, ','))
// This checks for a trailing comma with no data after it.
if (!lineStream && cell.empty())
// If there was a trailing comma then add an empty element.
std::vector<std::string> m_data;
std::istream& operator>>(std::istream& str, CSVRow& data)
return str;
int main()
std::ifstream file("plop.csv");
CSVRow row;
while(file >> row)
std::cout << "4th Element(" << row[3] << ")\n";
Mais avec un peu de travail, nous pourrions techniquement créer un itérateur:
class CSVIterator
typedef std::input_iterator_tag iterator_category;
typedef CSVRow value_type;
typedef std::size_t difference_type;
typedef CSVRow* pointer;
typedef CSVRow& reference;
CSVIterator(std::istream& str) :m_str(str.good()?&str:NULL) { ++(*this); }
CSVIterator() :m_str(NULL) {}
// Pre Increment
CSVIterator& operator++() {if (m_str) { if (!((*m_str) >> m_row)){m_str = NULL;}}return *this;}
// Post increment
CSVIterator operator++(int) {CSVIterator tmp(*this);++(*this);return tmp;}
CSVRow const& operator*() const {return m_row;}
CSVRow const* operator->() const {return &m_row;}
bool operator==(CSVIterator const& rhs) {return ((this == &rhs) || ((this->m_str == NULL) && (rhs.m_str == NULL)));}
bool operator!=(CSVIterator const& rhs) {return !((*this) == rhs);}
std::istream* m_str;
CSVRow m_row;
int main()
std::ifstream file("plop.csv");
for(CSVIterator loop(file); loop != CSVIterator(); ++loop)
std::cout << "4th Element(" << (*loop)[3] << ")\n";
Solution utilisant Boost Tokenizer:
std::vector<std::string> vec;
using namespace boost;
tokenizer<escaped_list_separator<char> > tk(
line, escaped_list_separator<char>('\\', ',', '\"'));
for (tokenizer<escaped_list_separator<char> >::iterator i(tk.begin());
Ma version n'utilise rien d'autre que la bibliothèque standard C++ 11. Il se débrouille bien avec la citation Excel CSV:
spam eggs,"foo,bar","""fizz buzz"""
Le code est écrit comme une machine à états finis et consomme un caractère à la fois. Je pense qu'il est plus facile de raisonner.
#include <istream>
#include <string>
#include <vector>
enum class CSVState {
std::vector<std::string> readCSVRow(const std::string &row) {
CSVState state = CSVState::UnquotedField;
std::vector<std::string> fields {""};
size_t i = 0; // index of the current field
for (char c : row) {
switch (state) {
case CSVState::UnquotedField:
switch (c) {
case ',': // end of field
fields.Push_back(""); i++;
case '"': state = CSVState::QuotedField;
default: fields[i].Push_back(c);
break; }
case CSVState::QuotedField:
switch (c) {
case '"': state = CSVState::QuotedQuote;
default: fields[i].Push_back(c);
break; }
case CSVState::QuotedQuote:
switch (c) {
case ',': // , after closing quote
fields.Push_back(""); i++;
state = CSVState::UnquotedField;
case '"': // "" -> "
state = CSVState::QuotedField;
default: // end of quote
state = CSVState::UnquotedField;
break; }
return fields;
/// Read CSV file, Excel dialect. Accept "quoted fields ""with quotes"""
std::vector<std::vector<std::string>> readCSV(std::istream &in) {
std::vector<std::vector<std::string>> table;
std::string row;
while (!in.eof()) {
std::getline(in, row);
if (in.bad() || {
auto fields = readCSVRow(row);
return table;
La bibliothèque de boîtes à outils C++ String (StrTk) possède une classe de grille de jetons qui vous permet de charger des données à partir de fichiers texte, chaînes ou tampons de caractères, et de les analyser/traiter en ligne/colonne.
Vous pouvez spécifier les délimiteurs de lignes et de colonnes ou simplement utiliser les valeurs par défaut.
void foo()
std::string data = "1,2,3,4,5\n"
strtk::token_grid grid(data,data.size(),",");
for(std::size_t i = 0; i < grid.row_count(); ++i)
strtk::token_grid::row_type r = grid.row(i);
for(std::size_t j = 0; j < r.size(); ++j)
std::cout << r.get<int>(j) << "\t";
std::cout << std::endl;
std::cout << std::endl;
Plus d'exemples peuvent être trouvés Ici
Il n’est pas excessif d’utiliser Spirit pour analyser des fichiers CSV. Spirit est bien adapté aux tâches de micro-analyse. Par exemple, avec Spirit 2.1, c'est aussi simple que:
bool r = phrase_parse(first, last,
// Begin grammar
double_ % ','
// End grammar
space, v);
Le vecteur, v, est bourré avec les valeurs. Il existe une série de didacticiels qui abordent ce sujet dans la nouvelle documentation Spirit 2.1 qui vient de paraître avec Boost 1.41.
Le tutoriel progresse du simple au complexe. Les analyseurs syntaxiques CSV sont présentés quelque part au milieu et abordent diverses techniques d’utilisation de Spirit. Le code généré est aussi serré que le code écrit à la main. Découvrez l'assembleur généré!
Vous pouvez utiliser Boost Tokenizer avec escaped_list_separator.
escaped_list_separator analyse un sur-ensemble du csv. Boost :: tokenizer
Cela utilise uniquement les fichiers d'en-tête Boost tokenizer, aucune liaison n'est nécessaire pour renforcer les bibliothèques.
Voici un exemple (voir Analyser un fichier CSV avec Boost Tokenizer en C++ pour plus d'informations ou Boost::tokenizer
#include <iostream> // cout, endl
#include <fstream> // fstream
#include <vector>
#include <string>
#include <algorithm> // copy
#include <iterator> // ostream_operator
#include <boost/tokenizer.hpp>
int main()
using namespace std;
using namespace boost;
string data("data.csv");
ifstream in(data.c_str());
if (!in.is_open()) return 1;
typedef tokenizer< escaped_list_separator<char> > Tokenizer;
vector< string > vec;
string line;
while (getline(in,line))
Tokenizer tok(line);
// vector now contains strings from one row, output to cout here
copy(vec.begin(), vec.end(), ostream_iterator<string>(cout, "|"));
cout << "\n----------------------" << endl;
Si VOUS tenez à analyser correctement le fichier CSV, cela le fera ... relativement lentement, car cela fonctionne caractère par caractère.
void ParseCSV(const string& csvSource, vector<vector<string> >& lines)
bool inQuote(false);
bool newLine(false);
string field;
vector<string> line;
string::const_iterator aChar = csvSource.begin();
while (aChar != csvSource.end())
switch (*aChar)
case '"':
newLine = false;
inQuote = !inQuote;
case ',':
newLine = false;
if (inQuote == true)
field += *aChar;
case '\n':
case '\r':
if (inQuote == true)
field += *aChar;
if (newLine == false)
newLine = true;
newLine = false;
if (field.size())
if (line.size())
Lorsque vous utilisez Boost Tokenizer escaped_list_separator pour les fichiers CSV, vous devez être conscient des éléments suivants:
Le format CSV spécifié par le wiki indique que les champs de données peuvent contenir des séparateurs entre guillemets (pris en charge):
1997, Ford, E350, "Super, camion luxueux"
Le format CSV spécifié par le wiki indique que les guillemets simples doivent être traités avec des guillemets doubles (escaped_list_separator supprimera tous les caractères de guillemets):
1997, Ford, E350, "Super" "Luxueux" "Camion"
Le format CSV ne précise pas que les caractères de barre oblique inverse doivent être supprimés (escaped_list_separator supprimera tous les caractères d'échappement).
Une solution possible pour corriger le comportement par défaut du boost escaped_list_separator:
Cette solution de contournement a pour effet secondaire de transformer les champs de données vides représentés par un guillemet double en un jeton à guillemet simple. Lorsque vous parcourez les jetons, vous devez vérifier si le jeton est un guillemet simple et le traiter comme une chaîne vide.
Pas joli mais ça marche, tant qu'il n'y a pas de nouvelles lignes entre les guillemets.
Vous voudrez peut-être examiner mon projet FOSS CSVfix ( updated link ), qui est un éditeur de flux CSV écrit en C++. L'analyseur CSV n'est pas un prix, mais fait le travail et tout le paquet peut faire ce dont vous avez besoin sans écrire de code.
Voir alib/src/a_csv.cpp pour l’analyseur CSV, et csvlib/src/csved_ioman.cpp (IOManager::ReadCSV
) pour un exemple d’utilisation.
Comme toutes les questions CSV semblent être redirigées ici, j'ai pensé poster ma réponse ici. Cette réponse ne répond pas directement à la question du demandeur. Je voulais être capable de lire dans un flux connu comme étant au format CSV, et les types de chaque champ étaient déjà connus. Bien entendu, la méthode ci-dessous peut être utilisée pour traiter chaque champ comme un type de chaîne.
Pour illustrer comment je souhaitais pouvoir utiliser un flux d'entrée CSV, considérons l'entrée suivante (tirée de la page de wikipedia sur CSV ):
const char input[] =
"1997,Ford,E350,\"ac, abs, moon\",3000.00\n"
"1999,Chevy,\"Venture \"\"Extended Edition\"\"\",\"\",4900.00\n"
"1999,Chevy,\"Venture \"\"Extended Edition, Very Large\"\"\",\"\",5000.00\n"
"1996,Jeep,Grand Cherokee,\"MUST SELL!\n\
air, moon roof, loaded\",4799.00\n"
Ensuite, je voulais pouvoir lire les données comme ceci:
std::istringstream ss(input);
std::string title[5];
int year;
std::string make, model, desc;
float price;
>> title[0] >> title[1] >> title[2] >> title[3] >> title[4];
while (csv_istream(ss)
>> year >> make >> model >> desc >> price) {
// something with the record...
C'était la solution avec laquelle je me suis retrouvé.
struct csv_istream {
std::istream &is_;
csv_istream (std::istream &is) : is_(is) {}
void scan_ws () const {
while (is_.good()) {
int c = is_.peek();
if (c != ' ' && c != '\t') break;
void scan (std::string *s = 0) const {
std::string ws;
int c = is_.get();
if (is_.good()) {
do {
if (c == ',' || c == '\n') break;
if (s) {
ws += c;
if (c != ' ' && c != '\t') {
*s += ws;
c = is_.get();
} while (is_.good());
if (is_.eof()) is_.clear();
template <typename T, bool> struct set_value {
void operator () (std::string in, T &v) const {
std::istringstream(in) >> v;
template <typename T> struct set_value<T, true> {
template <bool SIGNED> void convert (std::string in, T &v) const {
if (SIGNED) v = ::strtoll(in.c_str(), 0, 0);
else v = ::strtoull(in.c_str(), 0, 0);
void operator () (std::string in, T &v) const {
convert<is_signed_int<T>::val>(in, v);
template <typename T> const csv_istream & operator >> (T &v) const {
std::string tmp;
set_value<T, is_int<T>::val>()(tmp, v);
return *this;
const csv_istream & operator >> (std::string &v) const {
if (is_.peek() != '"') scan(&v);
else {
std::string tmp;
std::getline(is_, tmp, '"');
while (is_.peek() == '"') {
v += tmp;
v += is_.get();
std::getline(is_, tmp, '"');
v += tmp;
return *this;
template <typename T>
const csv_istream & operator >> (T &(*manip)(T &)) const {
is_ >> manip;
return *this;
operator bool () const { return !; }
Avec les assistants suivants, qui peuvent être simplifiés par les nouveaux modèles de traits intégrés dans C++ 11:
template <typename T> struct is_signed_int { enum { val = false }; };
template <> struct is_signed_int<short> { enum { val = true}; };
template <> struct is_signed_int<int> { enum { val = true}; };
template <> struct is_signed_int<long> { enum { val = true}; };
template <> struct is_signed_int<long long> { enum { val = true}; };
template <typename T> struct is_unsigned_int { enum { val = false }; };
template <> struct is_unsigned_int<unsigned short> { enum { val = true}; };
template <> struct is_unsigned_int<unsigned int> { enum { val = true}; };
template <> struct is_unsigned_int<unsigned long> { enum { val = true}; };
template <> struct is_unsigned_int<unsigned long long> { enum { val = true}; };
template <typename T> struct is_int {
enum { val = (is_signed_int<T>::val || is_unsigned_int<T>::val) };
Une autre solution similaire à La réponse de Loki Astari , en C++ 11. Les lignes ici sont std::Tuple
s d'un type donné. Le code analyse une ligne, puis jusqu'à chaque séparateur, puis convertit et exporte la valeur directement dans le Tuple (avec un peu de code de modèle).
for (auto row : csv<std::string, int, float>(file, ',')) {
std::cout << "first col: " << std::get<0>(row) << std::endl;
std::Tuple<t1, ...>
via operator>>
.Qu'est-ce qui manque:
Le code principal:
#include <iterator>
#include <sstream>
#include <string>
namespace csvtools {
/// Read the last element of the Tuple without calling recursively
template <std::size_t idx, class... fields>
typename std::enable_if<idx >= std::Tuple_size<std::Tuple<fields...>>::value - 1>::type
read_Tuple(std::istream &in, std::Tuple<fields...> &out, const char delimiter) {
std::string cell;
std::getline(in, cell, delimiter);
std::stringstream cell_stream(cell);
cell_stream >> std::get<idx>(out);
/// Read the @p idx-th element of the Tuple and then calls itself with @p idx + 1 to
/// read the next element of the Tuple. Automatically falls in the previous case when
/// reaches the last element of the Tuple thanks to enable_if
template <std::size_t idx, class... fields>
typename std::enable_if<idx < std::Tuple_size<std::Tuple<fields...>>::value - 1>::type
read_Tuple(std::istream &in, std::Tuple<fields...> &out, const char delimiter) {
std::string cell;
std::getline(in, cell, delimiter);
std::stringstream cell_stream(cell);
cell_stream >> std::get<idx>(out);
read_Tuple<idx + 1, fields...>(in, out, delimiter);
/// Iterable csv wrapper around a stream. @p fields the list of types that form up a row.
template <class... fields>
class csv {
std::istream &_in;
const char _delim;
typedef std::Tuple<fields...> value_type;
class iterator;
/// Construct from a stream.
inline csv(std::istream &in, const char delim) : _in(in), _delim(delim) {}
/// Status of the underlying stream
/// @{
inline bool good() const {
return _in.good();
inline const std::istream &underlying_stream() const {
return _in;
/// @}
inline iterator begin();
inline iterator end();
/// Reads a line into a stringstream, and then reads the line into a Tuple, that is returned
inline value_type read_row() {
std::string line;
std::getline(_in, line);
std::stringstream line_stream(line);
std::Tuple<fields...> retval;
csvtools::read_Tuple<0, fields...>(line_stream, retval, _delim);
return retval;
/// Iterator; just calls recursively @ref csv::read_row and stores the result.
template <class... fields>
class csv<fields...>::iterator {
csv::value_type _row;
csv *_parent;
typedef std::input_iterator_tag iterator_category;
typedef csv::value_type value_type;
typedef std::size_t difference_type;
typedef csv::value_type * pointer;
typedef csv::value_type & reference;
/// Construct an empty/end iterator
inline iterator() : _parent(nullptr) {}
/// Construct an iterator at the beginning of the @p parent csv object.
inline iterator(csv &parent) : _parent(parent.good() ? &parent : nullptr) {
/// Read one row, if possible. Set to end if parent is not good anymore.
inline iterator &operator++() {
if (_parent != nullptr) {
_row = _parent->read_row();
if (!_parent->good()) {
_parent = nullptr;
return *this;
inline iterator operator++(int) {
iterator copy = *this;
return copy;
inline csv::value_type const &operator*() const {
return _row;
inline csv::value_type const *operator->() const {
return &_row;
bool operator==(iterator const &other) {
return (this == &other) or (_parent == nullptr and other._parent == nullptr);
bool operator!=(iterator const &other) {
return not (*this == other);
template <class... fields>
typename csv<fields...>::iterator csv<fields...>::begin() {
return iterator(*this);
template <class... fields>
typename csv<fields...>::iterator csv<fields...>::end() {
return iterator();
Je mets un petit exemple de travail sur GitHub ; Je l'utilise pour analyser des données numériques et cela a bien servi.
Une autre bibliothèque d'E/S CSV peut être trouvée ici:
#include "csv.h"
int main(){
io::CSVReader<3> in("ram.csv");
in.read_header(io::ignore_extra_column, "vendor", "size", "speed");
std::string vendor; int size; double speed;
while(in.read_row(vendor, size, speed)){
// do stuff with the data
J'ai écrit un analyseur CSV C++ 11 en-tête uniquement . Il est bien testé, rapide, supporte l’ensemble des spécifications CSV (champs entre guillemets, délimiteur/terminateur entre guillemets, sauts de guillemets, etc.) et est configurable pour prendre en compte les CSV qui ne respectent pas les spécifications.
La configuration se fait via une interface fluide:
// constructor accepts any input stream
CsvParser parser = CsvParser(std::cin)
.delimiter(';') // delimited by ; instead of ,
.quote('\'') // quoted fields use ' instead of "
.terminator('\0'); // terminated by \0 instead of by \r\n, \n, or \r
L'analyse syntaxique est juste une plage basée sur la boucle:
#include <iostream>
#include "../parser.hpp"
using namespace aria::csv;
int main() {
std::ifstream f("some_file.csv");
CsvParser parser(f);
for (auto& row : parser) {
for (auto& field : row) {
std::cout << field << " | ";
std::cout << std::endl;
La première chose à faire est de s’assurer que le fichier existe. Pour accomplir cela, il vous suffit d'essayer d'ouvrir le flux de fichiers sur le chemin. Une fois que vous avez ouvert le flux de fichiers, utilisez () pour voir s’il a fonctionné comme prévu, avec ou sans.
bool fileExists(string fileName)
ifstream test;;
if (
return false;
return true;
Vous devez également vérifier que le fichier fourni est le type de fichier correct . Pour ce faire, vous devez parcourir le chemin du fichier fourni jusqu'à ce que Une fois que vous avez l'extension de fichier, assurez-vous qu'il s'agit bien d'un fichier .csv.
bool verifyExtension(string filename)
int period = 0;
for (unsigned int i = 0; i < filename.length(); i++)
if (filename[i] == '.')
period = i;
string extension;
for (unsigned int i = period; i < filename.length(); i++)
extension += filename[i];
if (extension == ".csv")
return true;
return false;
Cette fonction renverra l'extension de fichier utilisée ultérieurement dans un message d'erreur.
string getExtension(string filename)
int period = 0;
for (unsigned int i = 0; i < filename.length(); i++)
if (filename[i] == '.')
period = i;
string extension;
if (period != 0)
for (unsigned int i = period; i < filename.length(); i++)
extension += filename[i];
extension = "NO FILE";
return extension;
Cette fonction appellera en fait les contrôles d'erreur créés ci-dessus, puis analysera le fichier.
void parseFile(string fileName)
if (fileExists(fileName) && verifyExtension(fileName))
ifstream fs;;
string fileCommand;
while (fs.good())
string temp;
getline(fs, fileCommand, '\n');
for (unsigned int i = 0; i < fileCommand.length(); i++)
if (fileCommand[i] != ',')
temp += fileCommand[i];
temp += " ";
if (temp != "\0")
// Place your code here to run the file.
else if (!fileExists(fileName))
cout << "Error: The provided file does not exist: " << fileName << endl;
if (!verifyExtension(fileName))
if (getExtension(fileName) != "NO FILE")
cout << "\tCheck the file extension." << endl;
cout << "\tThere is no file in the provided path." << endl;
else if (!verifyExtension(fileName))
if (getExtension(fileName) != "NO FILE")
cout << "Incorrect file extension provided: " << getExtension(fileName) << endl;
cout << "There is no file in the following path: " << fileName << endl;
Voici une autre implémentation d'un analyseur Unicode CSV (fonctionne avec wchar_t). J'en ai écrit une partie, tandis que Jonathan Leffler a écrit le reste.
Remarque: cet analyseur a pour but de reproduire le comportement d'Excel le plus fidèlement possible, notamment lors de l'importation de fichiers CSV cassés ou mal formés.
Telle est la question initiale - Analyse de fichiers CSV avec des champs multilignes et des guillemets doubles échappés
C'est le code en tant que SSCCE (exemple court, autonome, correct).
#include <stdbool.h>
#include <wchar.h>
#include <wctype.h>
extern const wchar_t *nextCsvField(const wchar_t *p, wchar_t sep, bool *newline);
// Returns a pointer to the start of the next field,
// or zero if this is the last field in the CSV
// p is the start position of the field
// sep is the separator used, i.e. comma or semicolon
// newline says whether the field ends with a newline or with a comma
const wchar_t *nextCsvField(const wchar_t *p, wchar_t sep, bool *newline)
// Parse quoted sequences
if ('"' == p[0]) {
while (1) {
// Find next double-quote
p = wcschr(p, L'"');
// If we don't find it or it's the last symbol
// then this is the last field
if (!p || !p[1])
return 0;
// Check for "", it is an escaped double-quote
if (p[1] != '"')
// Skip the escaped double-quote
p += 2;
// Find next newline or comma.
wchar_t newline_or_sep[4] = L"\n\r ";
newline_or_sep[2] = sep;
p = wcspbrk(p, newline_or_sep);
// If no newline or separator, this is the last field.
if (!p)
return 0;
// Check if we had newline.
*newline = (p[0] == '\r' || p[0] == '\n');
// Handle "\r\n", otherwise just increment
if (p[0] == '\r' && p[1] == '\n')
p += 2;
return p;
static wchar_t *csvFieldData(const wchar_t *fld_s, const wchar_t *fld_e, wchar_t *buffer, size_t buflen)
wchar_t *dst = buffer;
wchar_t *end = buffer + buflen - 1;
const wchar_t *src = fld_s;
if (*src == L'"')
const wchar_t *p = src + 1;
while (p < fld_e && dst < end)
if (p[0] == L'"' && p+1 < fld_s && p[1] == L'"')
*dst++ = p[0];
p += 2;
else if (p[0] == L'"')
*dst++ = *p++;
src = p;
while (src < fld_e && dst < end)
*dst++ = *src++;
if (dst >= end)
return 0;
*dst = L'\0';
static void dissect(const wchar_t *line)
const wchar_t *start = line;
const wchar_t *next;
bool eol;
wprintf(L"Input %3zd: [%.*ls]\n", wcslen(line), wcslen(line)-1, line);
while ((next = nextCsvField(start, L',', &eol)) != 0)
wchar_t buffer[1024];
wprintf(L"Raw Field: [%.*ls] (eol = %d)\n", (next - start - eol), start, eol);
if (csvFieldData(start, next-1, buffer, sizeof(buffer)/sizeof(buffer[0])) != 0)
wprintf(L"Field %3zd: [%ls]\n", wcslen(buffer), buffer);
start = next;
static const wchar_t multiline[] =
L"First field of first row,\"This field is multiline\n"
"but that's OK because it's enclosed in double quotes, and this\n"
"is an escaped \"\" double quote\" but this one \"\" is not\n"
" \"This is second field of second row, but it is not multiline\n"
" because it doesn't start \n"
" with an immediate double quote\"\n"
int main(void)
wchar_t line[1024];
while (fgetws(line, sizeof(line)/sizeof(line[0]), stdin))
return 0;
Vous devez être fier lorsque vous utilisez quelque chose d'aussi beau que boost::spirit
Voici ma tentative d'un analyseur conforme (presque) aux spécifications CSV sur ce lien specs CSV (je n'avais pas besoin de sauts de ligne dans les champs. Les espaces autour des virgules sont également supprimés).
Une fois que vous aurez surmonté l’attente choquante d’attendre 10 secondes pour compiler ce code :), vous pourrez vous asseoir et en profiter.
// csvparser.cpp
#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/phoenix_operator.hpp>
#include <iostream>
#include <string>
namespace qi = boost::spirit::qi;
namespace bascii = boost::spirit::ascii;
template <typename Iterator>
struct csv_parser : qi::grammar<Iterator, std::vector<std::string>(),
qi::rule<Iterator, char() > COMMA;
qi::rule<Iterator, char() > DDQUOTE;
qi::rule<Iterator, std::string(), bascii::space_type > non_escaped;
qi::rule<Iterator, std::string(), bascii::space_type > escaped;
qi::rule<Iterator, std::string(), bascii::space_type > field;
qi::rule<Iterator, std::vector<std::string>(), bascii::space_type > start;
csv_parser() : csv_parser::base_type(start)
using namespace qi;
using qi::lit;
using qi::lexeme;
using bascii::char_;
start = field % ',';
field = escaped | non_escaped;
escaped = lexeme['"' >> *( char_ -(char_('"') | ',') | COMMA | DDQUOTE) >> '"'];
non_escaped = lexeme[ *( char_ -(char_('"') | ',') ) ];
DDQUOTE = lit("\"\"") [_val = '"'];
COMMA = lit(",") [_val = ','];
int main()
std::cout << "Enter CSV lines [empty] to quit\n";
using bascii::space;
typedef std::string::const_iterator iterator_type;
typedef csv_parser<iterator_type> csv_parser;
csv_parser grammar;
std::string str;
int fid;
while (getline(std::cin, str))
fid = 0;
if (str.empty())
std::vector<std::string> csv;
std::string::const_iterator it_beg = str.begin();
std::string::const_iterator it_end = str.end();
bool r = phrase_parse(it_beg, it_end, grammar, space, csv);
if (r && it_beg == it_end)
std::cout << "Parsing succeeded\n";
for (auto& field: csv)
std::cout << "field " << ++fid << ": " << field << std::endl;
std::cout << "Parsing failed\n";
return 0;
make csvparser
Test (exemple volé de Wikipedia ):
Enter CSV lines [empty] to quit
1999,Chevy,"Venture ""Extended Edition, Very Large""",,5000.00
Parsing succeeded
field 1: 1999
field 2: Chevy
field 3: Venture "Extended Edition, Very Large"
field 4:
field 5: 5000.00
1999,Chevy,"Venture ""Extended Edition, Very Large""",,5000.00"
Parsing failed
Voici le code pour lire une matrice, notez que vous avez aussi une fonction csvwrite dans matlab
void loadFromCSV( const std::string& filename )
std::ifstream file( filename.c_str() );
std::vector< std::vector<std::string> > matrix;
std::vector<std::string> row;
std::string line;
std::string cell;
while( file )
std::stringstream lineStream(line);
while( std::getline( lineStream, cell, ',' ) )
row.Push_back( cell );
if( !row.empty() )
matrix.Push_back( row );
for( int i=0; i<int(matrix.size()); i++ )
for( int j=0; j<int(matrix[i].size()); j++ )
std::cout << matrix[i][j] << " ";
std::cout << std::endl;
Cette solution détecte ces 4 cas
classe complète est à
1,field 2,field 3,
1,field 2,"field 3 quoted, with separator",
1,field 2,"field 3
with newline",
1,field 2,"field 3
with newline and separator,",
Il lit le fichier caractère par caractère, et lit 1 ligne à la fois en un vecteur (de chaînes), donc adapté aux très gros fichiers.
L'utilisation est
Itérez jusqu'à ce qu'une ligne vide soit renvoyée (fin du fichier). Une ligne est un vecteur où chaque entrée est une colonne CSV.
read_csv_t csv;"../test.csv");
std::vector<std::string> row;
while (true)
row = csv.read_row();
if (row.size() == 0)
la déclaration de classe
class read_csv_t
int open(const std::string &file_name);
std::vector<std::string> read_row();
std::ifstream m_ifs;
la mise en oeuvre
std::vector<std::string> read_csv_t::read_row()
bool quote_mode = false;
std::vector<std::string> row;
std::string column;
char c;
while (m_ifs.get(c))
switch (c)
//separator ',' detected.
//in quote mode add character to column
//Push column if not in quote mode
case ',':
if (quote_mode == true)
column += c;
//quote '"' detected.
//toggle quote mode
case '"':
quote_mode = !quote_mode;
//line end detected
//in quote mode add character to column
//return row if not in quote mode
case '\n':
case '\r':
if (quote_mode == true)
column += c;
return row;
//default, add character to column
column += c;
//return empty vector if end of file detected
std::vector<std::string> v;
return v;
Vous pouvez ouvrir et lire le fichier .csv à l’aide des fonctions fopen, fscanf, mais l’important est d’analyser le moyen data.Simplest d’analyser les données à l’aide de délimiter.En cas .csv, le délimiteur est ','.
Supposons que votre fichier data1.csv se présente comme suit:
vous pouvez segmenter les données et les stocker dans un tableau de caractères puis utiliser ultérieurement la fonction atoi (), etc., pour les conversions appropriées
FILE *fp;
char str1[10], str2[10], str3[10], str4[10];
fp = fopen("G:\\data1.csv", "r");
if(NULL == fp)
printf("\nError in opening file.");
return 0;
while(EOF != fscanf(fp, " %[^,], %[^,], %[^,], %s, %s, %s, %s ", str1, str2, str3, str4))
printf("\n%s %s %s %s", str1, str2, str3, str4);
[^,], ^ -il inverse la logique, signifie que toute chaîne ne contenant pas de virgule, alors dernier, dit de faire correspondre la virgule qui a terminé la chaîne précédente.
Excusez-moi, mais cela semble être une syntaxe complexe pour cacher quelques lignes de code.
Pourquoi pas ceci:
Read line from a CSV file
@param[in] fp file pointer to open file
@param[in] vls reference to vector of strings to hold next line
void readCSV( FILE *fp, std::vector<std::string>& vls )
if( ! fp )
char buf[10000];
if( ! fgets( buf,999,fp) )
std::string s = buf;
int p,q;
q = -1;
// loop over columns
while( 1 ) {
p = q;
q = s.find_first_of(",\n",p+1);
if( q == -1 )
vls.Push_back( s.substr(p+1,q-p-1) );
int _tmain(int argc, _TCHAR* argv[])
std::vector<std::string> vls;
FILE * fp = fopen( argv[1], "r" );
if( ! fp )
return 1;
readCSV( fp, vls );
readCSV( fp, vls );
readCSV( fp, vls );
std::cout << "row 3, col 4 is " << vls[3].c_str() << "\n";
return 0;
J'ai écrit une bonne manière d'analyser les fichiers CSV et j'ai pensé que je devrais l'ajouter comme réponse:
#include <algorithm>
#include <fstream>
#include <iostream>
#include <stdlib.h>
#include <stdio.h>
struct CSVDict
std::vector< std::string > inputImages;
std::vector< double > inputLabels;
\brief Splits the string
\param str String to split
\param delim Delimiter on the basis of which splitting is to be done
\return results Output in the form of vector of strings
std::vector<std::string> stringSplit( const std::string &str, const std::string &delim )
std::vector<std::string> results;
for (size_t i = 0; i < str.length(); i++)
std::string tempString = "";
while ((str[i] != *delim.c_str()) && (i < str.length()))
tempString += str[i];
return results;
\brief Parse the supplied CSV File and obtain Row and Column information.
1. Header information is in first row
2. Delimiters are only used to differentiate cell members
\param csvFileName The full path of the file to parse
\param inputColumns The string of input columns which contain the data to be used for further processing
\param inputLabels The string of input labels based on which further processing is to be done
\param delim The delimiters used in inputColumns and inputLabels
\return Vector of Vector of strings: Collection of rows and columns
std::vector< CSVDict > parseCSVFile( const std::string &csvFileName, const std::string &inputColumns, const std::string &inputLabels, const std::string &delim )
std::vector< CSVDict > return_CSVDict;
std::vector< std::string > inputColumnsVec = stringSplit(inputColumns, delim), inputLabelsVec = stringSplit(inputLabels, delim);
std::vector< std::vector< std::string > > returnVector;
std::ifstream inFile(csvFileName.c_str());
int row = 0;
std::vector< size_t > inputColumnIndeces, inputLabelIndeces;
for (std::string line; std::getline(inFile, line, '\n');)
CSVDict tempDict;
std::vector< std::string > rowVec;
line.erase(std::remove(line.begin(), line.end(), '"'), line.end());
rowVec = stringSplit(line, delim);
// for the first row, record the indeces of the inputColumns and inputLabels
if (row == 0)
for (size_t i = 0; i < rowVec.size(); i++)
for (size_t j = 0; j < inputColumnsVec.size(); j++)
if (rowVec[i] == inputColumnsVec[j])
for (size_t j = 0; j < inputLabelsVec.size(); j++)
if (rowVec[i] == inputLabelsVec[j])
for (size_t i = 0; i < inputColumnIndeces.size(); i++)
for (size_t i = 0; i < inputLabelIndeces.size(); i++)
double test = std::atof(rowVec[inputLabelIndeces[i]].c_str());
return return_CSVDict;
Pour ce que cela vaut, voici ma mise en œuvre. Il traite de l'entrée wstring, mais pourrait être facilement ajusté à la chaîne. Il ne gère pas les nouvelles lignes dans les champs (comme mon application non plus, mais l'ajout de son support n'est pas trop difficile) et il n'est pas conforme à la fin de ligne "\ r\n" selon RFC (si vous utilisez std :: getline), mais il gère correctement l’espacement des blancs et des guillemets (espérons-le).
using namespace std;
// trim whitespaces around field or double-quotes, remove double-quotes and replace escaped double-quotes (double double-quotes)
wstring trimquote(const wstring& str, const wstring& whitespace, const wchar_t quotChar)
wstring ws;
wstring::size_type strBegin = str.find_first_not_of(whitespace);
if (strBegin == wstring::npos)
return L"";
wstring::size_type strEnd = str.find_last_not_of(whitespace);
wstring::size_type strRange = strEnd - strBegin + 1;
if((str[strBegin] == quotChar) && (str[strEnd] == quotChar))
ws = str.substr(strBegin+1, strRange-2);
strBegin = 0;
while((strEnd = ws.find(quotChar, strBegin)) != wstring::npos)
ws.erase(strEnd, 1);
strBegin = strEnd+1;
ws = str.substr(strBegin, strRange);
return ws;
pair<unsigned, unsigned> nextCSVQuotePair(const wstring& line, const wchar_t quotChar, unsigned ofs = 0)
pair<unsigned, unsigned> r;
r.first = line.find(quotChar, ofs);
r.second = wstring::npos;
if(r.first != wstring::npos)
r.second = r.first;
while(((r.second = line.find(quotChar, r.second+1)) != wstring::npos)
&& (line[r.second+1] == quotChar)) // WARNING: assumes null-terminated string such that line[r.second+1] always exist
return r;
unsigned parseLine(vector<wstring>& fields, const wstring& line)
unsigned ofs, ofs0, np;
const wchar_t delim = L',';
const wstring whitespace = L" \t\xa0\x3000\x2000\x2001\x2002\x2003\x2004\x2005\x2006\x2007\x2008\x2009\x200a\x202f\x205f";
const wchar_t quotChar = L'\"';
pair<unsigned, unsigned> quot;
ofs = ofs0 = 0;
quot = nextCSVQuotePair(line, quotChar);
while((np = line.find(delim, ofs)) != wstring::npos)
if((np > quot.first) && (np < quot.second))
{ // skip delimiter inside quoted field
ofs = quot.second+1;
quot = nextCSVQuotePair(line, quotChar, ofs);
fields.Push_back( trimquote(line.substr(ofs0, np-ofs0), whitespace, quotChar) );
ofs = ofs0 = np+1;
fields.Push_back( trimquote(line.substr(ofs0), whitespace, quotChar) );
return fields.size();
Comme je ne suis pas habitué à booster pour le moment, je proposerai une solution plus simple. Supposons que votre fichier .csv comporte 100 lignes avec 10 chiffres dans chaque ligne, séparées par un ','. Vous pouvez charger ces données sous la forme d'un tableau avec le code suivant:
#include <iostream>
#include <fstream>
#include <sstream>
#include <string>
using namespace std;
int main()
int A[100][10];
ifstream ifs;"name_of_file.csv");
string s1;
char c;
for(int k=0; k<100; k++)
stringstream stream(s1);
int j=0;
stream >>A[k][j];
stream >> c;
if(!stream) {break;}
Vous pouvez utiliser cette bibliothèque:
Code par exemple:
#include <iostream>
#include "csvworker.h"
using namespace std;
int main()
CsvWorker csv;
cout << csv.getRowsNumber() << " " << csv.getColumnsNumber() << endl;
csv.getFieldRef(0, 2) = "0";
csv.getFieldRef(1, 1) = "0";
csv.getFieldRef(1, 3) = "0";
csv.getFieldRef(2, 0) = "0";
csv.getFieldRef(2, 4) = "0";
csv.getFieldRef(3, 1) = "0";
csv.getFieldRef(3, 3) = "0";
csv.getFieldRef(4, 2) = "0";
for(unsigned int i=0;i<csv.getRowsNumber();++i)
//cout << csv.getRow(i) << endl;
for(unsigned int j=0;j<csv.getColumnsNumber();++j)
cout << csv.getField(i, j) << ".";
cout << endl;
CsvWorker csv2(4,4);
csv2.getFieldRef(0, 0) = "a";
csv2.getFieldRef(0, 1) = "b";
csv2.getFieldRef(0, 2) = "r";
csv2.getFieldRef(0, 3) = "a";
csv2.getFieldRef(1, 0) = "c";
csv2.getFieldRef(1, 1) = "a";
csv2.getFieldRef(1, 2) = "d";
csv2.getFieldRef(2, 0) = "a";
csv2.getFieldRef(2, 1) = "b";
csv2.getFieldRef(2, 2) = "r";
csv2.getFieldRef(2, 3) = "a";
return 0;
Si vous ne souhaitez pas inclure d'incrément dans votre projet (il est considérable si vous ne l'utilisez que pour l'analyse CSV ...)
J'ai eu de la chance avec l'analyse CSV ici:
Il gère les champs entre guillemets, mais pas les caractères\n en ligne (ce qui convient probablement à la plupart des utilisations).
Un autre moyen simple et rapide consiste à utiliser Boost.Fusion I/O
#include <iostream>
#include <sstream>
#include <boost/fusion/adapted/boost_Tuple.hpp>
#include <boost/fusion/sequence/io.hpp>
namespace fusion = boost::fusion;
struct CsvString
std::string value;
// Stop reading a string once a CSV delimeter is encountered.
friend std::istream& operator>>(std::istream& s, CsvString& v) {
for(;;) {
auto c = s.peek();
if(std::istream::traits_type::eof() == c || ',' == c || '\n' == c)
return s;
friend std::ostream& operator<<(std::ostream& s, CsvString const& v) {
return s << v.value;
int main() {
std::stringstream input("abc,123,true,3.14\n"
typedef boost::Tuple<CsvString, int, bool, double> CsvRow;
using fusion::operator<<;
std::cout << std::boolalpha;
using fusion::operator>>;
input >> std::boolalpha;
input >> fusion::Tuple_open("") >> fusion::Tuple_close("\n") >> fusion::Tuple_delimiter(',');
for(CsvRow row; input >> row;)
std::cout << row << '\n';
Les sorties:
(abc 123 true 3.14)
(def 456 false 2.718)
Vous pouvez également consulter les fonctionnalités de la bibliothèque Qt
Il prend en charge les expressions régulières et la classe QString a des méthodes Nice, par exemple. split()
retournant QStringList, liste des chaînes obtenues en scindant la chaîne d'origine avec un délimiteur fourni. Devrait suffire pour le fichier csv ..
Pour obtenir une colonne avec un nom d’en-tête donné, j’utilise: c ++ héritage Qt problem qstring
Voici une fonction prête à l'emploi si tout ce dont vous avez besoin est de charger un fichier de données de doubles (pas d'entiers, pas de texte).
#include <sstream>
#include <fstream>
#include <iterator>
#include <string>
#include <vector>
#include <algorithm>
using namespace std;
* Parse a CSV data file and fill the 2d STL vector "data".
* Limits: only "pure datas" of doubles, not encapsulated by " and without \n inside.
* Further no formatting in the data (e.g. scientific notation)
* It however handles both dots and commas as decimal separators and removes thousand separator.
* returnCodes[0]: file access 0-> ok 1-> not able to read; 2-> decimal separator equal to comma separator
* returnCodes[1]: number of records
* returnCodes[2]: number of fields. -1 If rows have different field size
readCsvData (vector <vector <double>>& data, const string& filename, const string& delimiter, const string& decseparator){
int vv[3] = { 0,0,0 };
vector<int> returnCodes(&vv[0], &vv[0]+3);
string rowstring, stringtoken;
double doubletoken;
int rowcount=0;
int fieldcount=0;
ifstream iFile(filename, ios_base::in);
if (!iFile.is_open()){
returnCodes[0] = 1;
return returnCodes;
while (getline(iFile, rowstring)) {
if (rowstring=="") continue; // empty line
rowcount ++; //let's start with 1
if(delimiter == decseparator){
returnCodes[0] = 2;
return returnCodes;
if(decseparator != "."){
// remove dots (used as thousand separators)
string::iterator end_pos = remove(rowstring.begin(), rowstring.end(), '.');
rowstring.erase(end_pos, rowstring.end());
// replace decimal separator with dots.
replace(rowstring.begin(), rowstring.end(),decseparator.c_str()[0], '.');
} else {
// remove commas (used as thousand separators)
string::iterator end_pos = remove(rowstring.begin(), rowstring.end(), ',');
rowstring.erase(end_pos, rowstring.end());
// tokenize..
vector<double> tokens;
// Skip delimiters at beginning.
string::size_type lastPos = rowstring.find_first_not_of(delimiter, 0);
// Find first "non-delimiter".
string::size_type pos = rowstring.find_first_of(delimiter, lastPos);
while (string::npos != pos || string::npos != lastPos){
// Found a token, convert it to double add it to the vector.
stringtoken = rowstring.substr(lastPos, pos - lastPos);
if (stringtoken == "") {
} else {
istringstream totalSString(stringtoken);
totalSString >> doubletoken;
// Skip delimiters. Note the "not_of"
lastPos = rowstring.find_first_not_of(delimiter, pos);
// Find next "non-delimiter"
pos = rowstring.find_first_of(delimiter, lastPos);
if(rowcount == 1){
fieldcount = tokens.size();
returnCodes[2] = tokens.size();
} else {
if ( tokens.size() != fieldcount){
returnCodes[2] = -1;
returnCodes[1] = rowcount;
return returnCodes;
Il est possible d'utiliser std::regex
En fonction de la taille de votre fichier et de la mémoire disponible, il est possible de le lire ligne par ligne ou entièrement dans un std::string
Pour lire le fichier on peut utiliser:
std::ifstream t("file.txt");
std::string sin((std::istreambuf_iterator<char>(t)),
alors vous pouvez assortir ceci qui est réellement personnalisable à vos besoins.
std::regex Word_regex(",\\s]+");
auto what =
std::sregex_iterator(sin.begin(), sin.end(), Word_regex);
auto wend = std::sregex_iterator();
std::vector<std::string> v;
for (;what!=wend ; wend) {
std::smatch match = *what;
Ceci est un vieux fil de discussion mais reste en tête des résultats de recherche. J'ajoute donc ma solution en utilisant std :: stringstream et une méthode de remplacement de chaîne simple par Yves Baumes.
L'exemple suivant lit un fichier, ligne par ligne, ignore les lignes de commentaire commençant par // et analyse les autres lignes en une combinaison de chaînes, entiers et doubles. Stringstream effectue l'analyse, mais s'attend à ce que les champs soient délimités par des espaces; j'utilise donc stringreplace pour transformer les virgules en espaces en premier. Il gère les tabulations correctement, mais ne traite pas les chaînes entre guillemets.
Les entrées incorrectes ou manquantes sont simplement ignorées, ce qui peut être ou ne pas être bon, selon votre situation.
#include <string>
#include <sstream>
#include <fstream>
void StringReplace(std::string& str, const std::string& oldStr, const std::string& newStr)
// code by Yves Baumes
size_t pos = 0;
while((pos = str.find(oldStr, pos)) != std::string::npos)
str.replace(pos, oldStr.length(), newStr);
pos += newStr.length();
void LoadCSV(std::string &filename) {
std::ifstream stream(filename);
std::string in_line;
std::string Field;
std::string Chan;
int ChanType;
double Scale;
int Import;
while (std::getline(stream, in_line)) {
StringReplace(in_line, ",", " ");
std::stringstream line(in_line);
line >> Field >> Chan >> ChanType >> Scale >> Import;
if (Field.substr(0,2)!="//") {
// do your stuff
// this is CBuilder code for demonstration, sorry
ShowMessage((String)Field.c_str() + "\n" + Chan.c_str() + "\n" + IntToStr(ChanType) + "\n" +FloatToStr(Scale) + "\n" +IntToStr(Import));
J'ai une solution plus rapide, était à l'origine destiné à cette question:
Comment tirer une partie spécifique de différentes chaînes?
Mais c'était fermé évidemment. Je ne suis pas sur le point de jeter cela cependant:
#include <iostream>
#include <string>
#include <regex>
std::string text = "\"4,\"\"3\"\",\"\"Mon May 11 03:17:40 UTC 2009\"\",\"\"Kindle2\"\",\"\"tpryan\"\",\"\"TEXT HERE\"\"\";;;;";
int main()
std::regex r("(\".*\")(\".*\")(\".*\")(\".*\")(\".*\")(\".*\")(\".*\")(\".*\")(\".*\")(\".*\")");
std::smatch m;
std::regex_search(text, m, r);
std::cout<<"FOUND: "<<m[9]<<std::endl;
return 0;
Choisissez simplement la correspondance que vous voulez dans la collection smatch par index .
Si vous utilisez Visual Studio/MFC, la solution suivante peut vous faciliter la vie. Il supporte à la fois Unicode et MBCS, a des commentaires, n'a pas de dépendances autres que CString et fonctionne assez bien pour moi. Il ne prend pas en charge les sauts de ligne incorporés dans une chaîne entre guillemets, mais je m'en fiche tant que ça ne plante pas dans ce cas, ce qui n'est pas le cas.
La stratégie globale consiste à traiter les guillemets entre guillemets et vides comme des cas spéciaux et à utiliser Tokenize pour le reste. Pour les chaînes entre guillemets, la stratégie consiste à trouver le vrai guillemet final en gardant la trace de la présence de paires de guillemets consécutifs. Si c'était le cas, utilisez Remplacer pour convertir les paires en simples. Il existe sans doute des méthodes plus efficaces, mais les performances n'étaient pas suffisamment critiques dans mon cas pour justifier une optimisation supplémentaire.
class CParseCSV {
// Construction
CParseCSV(const CString& sLine);
// Attributes
bool GetString(CString& sDest);
CString m_sLine; // line to extract tokens from
int m_nLen; // line length in characters
int m_iPos; // index of current position
CParseCSV::CParseCSV(const CString& sLine) : m_sLine(sLine)
m_nLen = m_sLine.GetLength();
m_iPos = 0;
bool CParseCSV::GetString(CString& sDest)
if (m_iPos < 0 || m_iPos > m_nLen) // if position out of range
return false;
if (m_iPos == m_nLen) { // if at end of string
sDest.Empty(); // return empty token
m_iPos = -1; // really done now
return true;
if (m_sLine[m_iPos] == '\"') { // if current char is double quote
m_iPos++; // advance to next char
int iTokenStart = m_iPos;
bool bHasEmbeddedQuotes = false;
while (m_iPos < m_nLen) { // while more chars to parse
if (m_sLine[m_iPos] == '\"') { // if current char is double quote
// if next char exists and is also double quote
if (m_iPos < m_nLen - 1 && m_sLine[m_iPos + 1] == '\"') {
// found pair of consecutive double quotes
bHasEmbeddedQuotes = true; // request conversion
m_iPos++; // skip first quote in pair
} else // next char doesn't exist or is normal
break; // found closing quote; exit loop
m_iPos++; // advance to next char
sDest = m_sLine.Mid(iTokenStart, m_iPos - iTokenStart);
if (bHasEmbeddedQuotes) // if string contains embedded quote pairs
sDest.Replace(_T("\"\""), _T("\"")); // convert pairs to singles
m_iPos += 2; // skip closing quote and trailing delimiter if any
} else if (m_sLine[m_iPos] == ',') { // else if char is comma
sDest.Empty(); // return empty token
m_iPos++; // advance to next char
} else { // else get next comma-delimited token
sDest = m_sLine.Tokenize(_T(","), m_iPos);
return true;
// calling code should look something like this:
CStdioFile fIn(pszPath, CFile::modeRead);
CString sLine, sToken;
while (fIn.ReadString(sLine)) { // for each line of input file
if (!sLine.IsEmpty()) { // ignore blank lines
CParseCSV csv(sLine);
while (csv.GetString(sToken)) {
// do something with sToken here