Quelqu'un a-t-il une idée de l'endroit où je pourrais trouver du code javascript pour analyser les données CSV?
Vous pouvez utiliser la fonction CSVToArray () mentionnée dans cette entrée de blog.
<script type="text/javascript">
// ref: http://stackoverflow.com/a/1293163/2343
// This will parse a delimited string into an array of
// arrays. The default delimiter is the comma, but this
// can be overriden in the second argument.
function CSVToArray( strData, strDelimiter ){
// Check to see if the delimiter is defined. If not,
// then default to comma.
strDelimiter = (strDelimiter || ",");
// Create a regular expression to parse the CSV values.
var objPattern = new RegExp(
(
// Delimiters.
"(\\" + strDelimiter + "|\\r?\\n|\\r|^)" +
// Quoted fields.
"(?:\"([^\"]*(?:\"\"[^\"]*)*)\"|" +
// Standard fields.
"([^\"\\" + strDelimiter + "\\r\\n]*))"
),
"gi"
);
// Create an array to hold our data. Give the array
// a default empty first row.
var arrData = [[]];
// Create an array to hold our individual pattern
// matching groups.
var arrMatches = null;
// Keep looping over the regular expression matches
// until we can no longer find a match.
while (arrMatches = objPattern.exec( strData )){
// Get the delimiter that was found.
var strMatchedDelimiter = arrMatches[ 1 ];
// Check to see if the given delimiter has a length
// (is not the start of string) and if it matches
// field delimiter. If id does not, then we know
// that this delimiter is a row delimiter.
if (
strMatchedDelimiter.length &&
strMatchedDelimiter !== strDelimiter
){
// Since we have reached a new row of data,
// add an empty row to our data array.
arrData.Push( [] );
}
var strMatchedValue;
// Now that we have our delimiter out of the way,
// let's check to see which kind of value we
// captured (quoted or unquoted).
if (arrMatches[ 2 ]){
// We found a quoted value. When we capture
// this value, unescape any double quotes.
strMatchedValue = arrMatches[ 2 ].replace(
new RegExp( "\"\"", "g" ),
"\""
);
} else {
// We found a non-quoted value.
strMatchedValue = arrMatches[ 3 ];
}
// Now that we have our value string, let's add
// it to the data array.
arrData[ arrData.length - 1 ].Push( strMatchedValue );
}
// Return the parsed data.
return( arrData );
}
</script>
Je pense que je peux battre suffisamment réponse de Kirtan
Entrez jQuery-CSV
C'est un plugin jquery conçu pour fonctionner comme une solution de bout en bout pour l'analyse de CSV dans des données Javascript. Il traite chaque cas Edge présenté dans RFC 418 , ainsi que certains éléments qui apparaissent lors d'exportations Excel/Google Spreadsheed (c.-à-d. Impliquant principalement des valeurs nulles) pour lesquelles la spécification est manquante.
Exemple:
piste, artiste, album, année
Dangerous, 'Busta Rhymes', 'When Disaster Strikes', 1997
// calling this
music = $.csv.toArrays(csv)
// outputs...
[
["track","artist","album","year"],
["Dangerous","Busta Rhymes","When Disaster Strikes","1997"]
]
console.log(music[1][2]) // outputs: 'When Disaster Strikes'
Mise à jour:
Oh oui, je devrais aussi mentionner que c'est complètement configurable.
music = $.csv.toArrays(csv, {
delimiter:"'", // sets a custom value delimiter character
separator:';', // sets a custom field separator character
});
Mise à jour 2:
Cela fonctionne maintenant avec jQuery sur Node.js aussi. Vous avez donc la possibilité d'effectuer une analyse syntaxique côté client ou côté serveur avec la même bibliothèque.
Mise à jour 3:
Depuis l'arrêt de Google Code, jquery-csv a été migré vers GitHub .
Avertissement: Je suis également l'auteur de jQuery-CSV.
J'ai un implémentation dans le cadre d'un projet de tableur.
Ce code n'a pas encore été testé à fond, mais tout le monde est invité à l'utiliser.
Comme certaines réponses l’ont noté, votre mise en œuvre peut être beaucoup plus simple si vous avez réellement le fichier DSV ou TSV , car ils interdisent l’utilisation de l’enregistrement et séparateurs de champs dans les valeurs. Le format CSV, en revanche, peut contenir des virgules et des nouvelles lignes à l'intérieur d'un champ, ce qui interrompt la plupart des approches basées sur les expressions rationnelles et les divisions.
var CSV = {
parse: function(csv, reviver) {
reviver = reviver || function(r, c, v) { return v; };
var chars = csv.split(''), c = 0, cc = chars.length, start, end, table = [], row;
while (c < cc) {
table.Push(row = []);
while (c < cc && '\r' !== chars[c] && '\n' !== chars[c]) {
start = end = c;
if ('"' === chars[c]){
start = end = ++c;
while (c < cc) {
if ('"' === chars[c]) {
if ('"' !== chars[c+1]) { break; }
else { chars[++c] = ''; } // unescape ""
}
end = ++c;
}
if ('"' === chars[c]) { ++c; }
while (c < cc && '\r' !== chars[c] && '\n' !== chars[c] && ',' !== chars[c]) { ++c; }
} else {
while (c < cc && '\r' !== chars[c] && '\n' !== chars[c] && ',' !== chars[c]) { end = ++c; }
}
row.Push(reviver(table.length-1, row.length, chars.slice(start, end).join('')));
if (',' === chars[c]) { ++c; }
}
if ('\r' === chars[c]) { ++c; }
if ('\n' === chars[c]) { ++c; }
}
return table;
},
stringify: function(table, replacer) {
replacer = replacer || function(r, c, v) { return v; };
var csv = '', c, cc, r, rr = table.length, cell;
for (r = 0; r < rr; ++r) {
if (r) { csv += '\r\n'; }
for (c = 0, cc = table[r].length; c < cc; ++c) {
if (c) { csv += ','; }
cell = replacer(r, c, table[r][c]);
if (/[,\r\n"]/.test(cell)) { cell = '"' + cell.replace(/"/g, '""') + '"'; }
csv += (cell || 0 === cell) ? cell : '';
}
}
return csv;
}
};
Voici un analyseur CSV extrêmement simple qui gère les champs entre guillemets, des virgules, de nouvelles lignes et les guillemets doubles échappés. Il n'y a pas de division ou de RegEx. Il analyse la chaîne d'entrée 1 à 2 caractères à la fois et construit un tableau.
Testez-le à http://jsfiddle.net/vHKYH/ .
function parseCSV(str) {
var arr = [];
var quote = false; // true means we're inside a quoted field
// iterate over each character, keep track of current row and column (of the returned array)
for (var row = 0, col = 0, c = 0; c < str.length; c++) {
var cc = str[c], nc = str[c+1]; // current character, next character
arr[row] = arr[row] || []; // create a new row if necessary
arr[row][col] = arr[row][col] || ''; // create a new column (start with empty string) if necessary
// If the current character is a quotation mark, and we're inside a
// quoted field, and the next character is also a quotation mark,
// add a quotation mark to the current column and skip the next character
if (cc == '"' && quote && nc == '"') { arr[row][col] += cc; ++c; continue; }
// If it's just one quotation mark, begin/end quoted field
if (cc == '"') { quote = !quote; continue; }
// If it's a comma and we're not in a quoted field, move on to the next column
if (cc == ',' && !quote) { ++col; continue; }
// If it's a newline (CRLF) and we're not in a quoted field, skip the next character
// and move on to the next row and move to column 0 of that new row
if (cc == '\r' && nc == '\n' && !quote) { ++row; col = 0; ++c; continue; }
// If it's a newline (LF or CR) and we're not in a quoted field,
// move on to the next row and move to column 0 of that new row
if (cc == '\n' && !quote) { ++row; col = 0; continue; }
if (cc == '\r' && !quote) { ++row; col = 0; continue; }
// Otherwise, append the current character to the current column
arr[row][col] += cc;
}
return arr;
}
csvToArray v1.3
Une fonction compacte (645 octets), mais compatible, permettant de convertir une chaîne CSV en un tableau 2D conforme à la norme RFC4180.
https://code.google.com/archive/p/csv-to-array/downloads
Utilisation commune: jQuery
$.ajax({
url: "test.csv",
dataType: 'text',
cache: false
}).done(function(csvAsString){
csvAsArray=csvAsString.csvToArray();
});
Usage commun: Javascript
csvAsArray = csvAsString.csvToArray();
Remplacer le séparateur de champ
csvAsArray = csvAsString.csvToArray("|");
Ignorer l'enregistrement du séparateur
csvAsArray = csvAsString.csvToArray("", "#");
Ignorer l'en-tête de saut
csvAsArray = csvAsString.csvToArray("", "", 1);
Remplacer tout
csvAsArray = csvAsString.csvToArray("|", "#", 1);
Voici ma grammaire PEG (.js) qui semble bien fonctionner à la RFC 4180 (c'est-à-dire qu'elle traite les exemples à l'adresse http://en.wikipedia.org/wiki/Comma-separated_values ):
start
= [\n\r]* first:line rest:([\n\r]+ data:line { return data; })* [\n\r]* { rest.unshift(first); return rest; }
line
= first:field rest:("," text:field { return text; })*
& { return !!first || rest.length; } // ignore blank lines
{ rest.unshift(first); return rest; }
field
= '"' text:char* '"' { return text.join(''); }
/ text:[^\n\r,]* { return text.join(''); }
char
= '"' '"' { return '"'; }
/ [^"]
Essayez-le à http://jsfiddle.net/knvzk/1 ou http://pegjs.majda.cz/online . Téléchargez l'analyseur généré à l'adresse https://Gist.github.com/33628 .
Je ne sais pas pourquoi je ne pouvais pas kirtans ex. travailler pour moi. Il semblait échouer sur les champs vides ou peut-être des champs avec des virgules de fin ...
Celui-ci semble gérer les deux.
Je n'ai pas écrit le code de l'analyseur, mais juste un wrapper autour de la fonction de l'analyseur pour que cela fonctionne pour un fichier. voir Attribution
var Strings = {
/**
* Wrapped csv line parser
* @param s string delimited csv string
* @param sep separator override
* @attribution : http://www.greywyvern.com/?post=258 (comments closed on blog :( )
*/
parseCSV : function(s,sep) {
// http://stackoverflow.com/questions/1155678/javascript-string-newline-character
var universalNewline = /\r\n|\r|\n/g;
var a = s.split(universalNewline);
for(var i in a){
for (var f = a[i].split(sep = sep || ","), x = f.length - 1, tl; x >= 0; x--) {
if (f[x].replace(/"\s+$/, '"').charAt(f[x].length - 1) == '"') {
if ((tl = f[x].replace(/^\s+"/, '"')).length > 1 && tl.charAt(0) == '"') {
f[x] = f[x].replace(/^\s*"|"\s*$/g, '').replace(/""/g, '"');
} else if (x) {
f.splice(x - 1, 2, [f[x - 1], f[x]].join(sep));
} else f = f.shift().split(sep).concat(f);
} else f[x].replace(/""/g, '"');
} a[i] = f;
}
return a;
}
}