web-dev-qa-db-fra.com

Afficher le contenu d'un énorme fichier txt / json sans extraire un énorme fichier Zip

J'ai un fichier Zip de ~ 400Mo et il contient certains fichiers txt/json de taille approximative allant de 400Mo à 1 Go.

Je veux simplement afficher les 100 premières lignes d'un fichier cible sans l'extraire du fichier Zip, sans épuiser ma mémoire .(très faible)

Il existe également une option pour fractionner le fichier cible dans le fichier Zip, sans extraire et le faire de manière séquentielle, c’est-à-dire que lorsque vous donnez la commande split avec 50 Mo, par exemple, je n’obtiens que le premier fichier fractionné, le visualise, puis, continuer la scission pour un deuxième fichier, le visualiser, continuer pour un troisième fichier de 50 Mo, le visualiser, encore et encore?

3
arjun

Ok les étapes seraient:

  1. Pour obtenir le nom du fichier dans l'archive que vous souhaitez visualiser, vous devez répertorier le contenu (du fichier Zip) à l'aide de cette commande:

    unzip -l file.Zip
    
  2. Maintenant, pour voir les premières lignes 100:

    unzip -c file.Zip file/name_of_file_of_interest.json | head -100
    

Note:

  1. Ce format

    unzip -c file.Zip file/name_of_file_of_interest.json
    

    est nécessaire, pas

    unzip -c file.Zip name_of_file_of_interest.json
    

    pour accéder au chemin du fichier et sera obtenu lorsque la commande dans step 1 sera exécutée.

Exemple:

  1. Fichier unzip -l wordpress-4.7.Zip, produit

     ...
     0  2016-12-06 19:40   wordpress/wp-includes/Text/Diff/Renderer/
     5535  2010-02-19 02:25   wordpress/wp-includes/Text/Diff/Renderer/inline.php
     6813  2015-06-28 16:27   wordpress/wp-includes/Text/Diff/Renderer.php
    12950  2015-06-28 16:27   wordpress/wp-includes/Text/Diff.php
    14460  2016-12-02 08:11   wordpress/wp-includes/class-wp-hook.php
    34760  2016-12-01 03:19   wordpress/wp-includes/rest-api.php
    23621  2016-11-21 03:46   wordpress/wp-includes/update.php
    102116  2016-12-04 21:37   wordpress/wp-includes/comment.php
    14066  2016-08-25 18:37   wordpress/wp-includes/class-wp-text-diff-renderer-table.php
    2853  2015-12-16 10:58   wordpress/wp-config-sample.php
    
  2. Maintenant, je veux voir d'abord 100 lignes du fichier wp-config-sample.php dans wordpress-4.7.Zip, alors je fais:

    unzip -p wordpress-4.7.Zip wordpress/wp-config-sample.php | head -100
    

Plus d'information:

  1. Pourquoi utiliser l'option -p:

     -p     extract files to pipe (stdout).  Nothing but the file data is sent to stdout, and the files are  always
          extracted in binary format, just as they are stored (no conversions).
    

Une sortie plus élagante serait avec less

less wordpress-4.7.Zip

# OUTPUT

    Archive:  wordpress-4.7.Zip
 Length   Method    Size  Cmpr    Date    Time   CRC-32   Name
--------  ------  ------- ---- ---------- ----- --------  ----
       0  Stored        0   0% 2016-12-06 19:40 00000000  wordpress/
   16250  Defl:X     4157  74% 2016-11-29 06:39 2b3bf692  wordpress/wp-settings.php
    3286  Defl:X     1397  58% 2015-05-24 18:26 e732ef29  wordpress/wp-cron.php
    1627  Defl:X      799  51% 2016-08-29 13:00 d0339e89  wordpress/wp-comments-post.php
    5447  Defl:X     2006  63% 2016-09-27 22:36 888ccd8b  wordpress/wp-activate.php
       0  Stored        0   0% 2016-12-06 19:40 00000000  wordpress/wp-admin/
    2401  Defl:X      933  61% 2016-10-24 05:45 1e03d7a9  wordpress/wp-admin/link-parse-opml.php
       0  Stored        0   0% 2016-12-06 19:40 00000000  wordpress/wp-admin/js/
   12000  Defl:X     3291  73% 2016-09-13 07:03 77f8b8cb  wordpress/wp-admin/js/editor.js
    6224  Defl:X     2215  64% 2016-11-03 06:40 693a34f0  wordpress/wp-admin/js/user-profile.min.js
    1508  Defl:X      640  58% 2015-07-27 12:19 ee45bde7  wordpress/wp-admin/js/Word-count.min.js
    5148  Defl:X     2010  61% 2016-11-17 19:28 2384dae7  wordpress/wp-admin/js/tags-suggest.js
    6842  Defl:X     2399  65% 2016-10-23 19:16 41742fcd  wordpress/wp-admin/js/tags-box.js
   17717  Defl:X     5102  71% 2016-07-05 14:37 93dfd6b0  wordpress/wp-admin/js/image-edit.js
   34299  Defl:X     7077  79% 2016-11-04 18:18 97b89baa  wordpress/wp-admin/js/updates.min.js
    4192  Defl:X     1539  63% 2016-06-08 23:37 b8c4c822  wordpress/wp-admin/js/postbox.min.js
   20983  Defl:X     6187  71% 2016-11-03 06:40 3aec32c2  wordpress/wp-admin/js/nav-menu.min.js
   25330  Defl:X     7009  72% 2016-11-03 06:40 43591b6e  wordpress/wp-admin/js/theme.min.js
    1502  Defl:X      707  53% 2013-11-14 06:40 4dc0acc0  wordpress/wp-admin/js/custom-header.js
   11462  Defl:X     4344  62% 2016-11-03 06:40 0aa95325  wordpress/wp-admin/js/press-this.min.js
7
George Udosen