Comment implémenter l'indentation personnalisée lors d'une jolie impression avec le module JSON?

Question

J'utilise donc Python 2.7, en utilisant le module json pour encoder la structure de données suivante:

'layer1': { 'layer2': { 'layer3_1': [ long_list_of_stuff ], 'layer3_2': 'string' } }

Mon problème est que j'imprime tout en utilisant une jolie impression, comme suit:

json.dumps(data_structure, indent=2)

Ce qui est génial, sauf que je veux tout mettre en retrait, sauf pour le contenu dans "layer3_1" - Il s'agit d'un dictionnaire massif répertoriant les coordonnées, et en tant que tel, le fait d'avoir une seule valeur définie pour chacune permet une jolie impression de créer un fichier avec des milliers de lignes, avec un exemple comme suit:

{ "layer1": { "layer2": { "layer3_1": [ { "x": 1, "y": 7 }, { "x": 0, "y": 4 }, { "x": 5, "y": 3 }, { "x": 6, "y": 9 } ], "layer3_2": "string" } } }

Ce que je veux vraiment, c'est quelque chose de similaire à ce qui suit:

{ "layer1": { "layer2": { "layer3_1": [{"x":1,"y":7},{"x":0,"y":4},{"x":5,"y":3},{"x":6,"y":9}], "layer3_2": "string" } } }

J'entends qu'il est possible d'étendre le module json: est-il possible de le configurer pour désactiver uniquement l'indentation à l'intérieur du "layer3_1" objet? Si oui, quelqu'un pourrait-il me dire comment?

martineau · Accepted Answer

Mise à jour

Vous trouverez ci-dessous une version de ma réponse originale qui a été révisée plusieurs fois. Contrairement à l'original, que j'ai publié uniquement pour montrer comment faire fonctionner la première idée dans JFSebastian answer , et qui comme la sienne, a renvoyé une chaîne non indentée représentation de l'objet. La dernière version mise à jour renvoie l'objet Python JSON formaté de manière isolée.

Les clés de chaque coordonnée dict apparaîtront dans l'ordre trié, conformément à l'un des commentaires de l'OP, mais uniquement si un argument de mot clé sort_keys=True Est spécifié dans l'appel initial de json.dumps() conduire le processus, et il ne change plus le type de l'objet en une chaîne en cours de route. En d'autres termes, le type réel de l'objet "encapsulé" est maintenant conservé.

Je pense que le fait de ne pas comprendre l'intention initiale de mon message a entraîné un certain nombre de votes négatifs. Donc, principalement pour cette raison, j'ai "corrigé" et amélioré ma réponse à plusieurs reprises. La version actuelle est un hybride de ma réponse originale couplée à certaines des idées @Erik Allik utilisées dans son réponse , ainsi que des commentaires utiles d'autres utilisateurs indiqués dans les commentaires sous cette réponse.

Le code suivant semble fonctionner inchangé dans les deux Python 2.7.16 et 3.7.4.

from _ctypes import PyObj_FromPtr import json import re class NoIndent(object): """ Value wrapper. """ def __init__(self, value): self.value = value class MyEncoder(json.JSONEncoder): FORMAT_SPEC = '@@{}@@' regex = re.compile(FORMAT_SPEC.format(r'(\d+)')) def __init__(self, **kwargs): # Save copy of any keyword argument values needed for use here. self.__sort_keys = kwargs.get('sort_keys', None) super(MyEncoder, self).__init__(**kwargs) def default(self, obj): return (self.FORMAT_SPEC.format(id(obj)) if isinstance(obj, NoIndent) else super(MyEncoder, self).default(obj)) def encode(self, obj): format_spec = self.FORMAT_SPEC # Local var to expedite access. json_repr = super(MyEncoder, self).encode(obj) # Default JSON. # Replace any marked-up object ids in the JSON repr with the # value returned from the json.dumps() of the corresponding # wrapped Python object. for match in self.regex.finditer(json_repr): # see https://stackoverflow.com/a/15012814/355230 id = int(match.group(1)) no_indent = PyObj_FromPtr(id) json_obj_repr = json.dumps(no_indent.value, sort_keys=self.__sort_keys) # Replace the matched id string with json formatted representation # of the corresponding Python object. json_repr = json_repr.replace( '"{}"'.format(format_spec.format(id)), json_obj_repr) return json_repr if __name__ == '__main__': from string import ascii_lowercase as letters data_structure = { 'layer1': { 'layer2': { 'layer3_1': NoIndent([{"x":1,"y":7}, {"x":0,"y":4}, {"x":5,"y":3}, {"x":6,"y":9}, {k: v for v, k in enumerate(letters)}]), 'layer3_2': 'string', 'layer3_3': NoIndent([{"x":2,"y":8,"z":3}, {"x":1,"y":5,"z":4}, {"x":6,"y":9,"z":8}]), 'layer3_4': NoIndent(list(range(20))), } } } print(json.dumps(data_structure, cls=MyEncoder, sort_keys=True, indent=2))

Production:

{ "layer1": { "layer2": { "layer3_1": [{"x": 1, "y": 7}, {"x": 0, "y": 4}, {"x": 5, "y": 3}, {"x": 6, "y": 9}, {"a": 0, "b": 1, "c": 2, "d": 3, "e": 4, "f": 5, "g": 6, "h": 7, "i": 8, "j": 9, "k": 10, "l": 11, "m": 12, "n": 13, "o": 14, "p": 15, "q": 16, "r": 17, "s": 18, "t": 19, "u": 20, "v": 21, "w": 22, "x": 23, "y": 24, "z": 25}], "layer3_2": "string", "layer3_3": [{"x": 2, "y": 8, "z": 3}, {"x": 1, "y": 5, "z": 4}, {"x": 6, "y": 9, "z": 8}], "layer3_4": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19] } } }

M Somerville · Answer

Un bodge, mais une fois que vous avez la chaîne de dumps (), vous pouvez effectuer une substitution d'expression régulière dessus, si vous êtes sûr du format de son contenu. Quelque chose dans le sens de:

s = json.dumps(data_structure, indent=2) s = re.sub('\s*{\s*"(.)": (\d+),\s*"(.)": (\d+)\s*}(,?)\s*', r'{"\1":\2,"\3":\4}\5', s)

Erik Kaplun · Answer

La solution suivante semble fonctionner correctement sur Python 2.7.x. Elle utilise une solution de contournement tirée de Encodeur JSON personnalisé dans Python 2.7 pour insérer plain) Code JavaScript pour éviter que les objets codés personnalisés se retrouvent sous forme de chaînes JSON dans la sortie en utilisant un schéma de remplacement basé sur UUID.

class NoIndent(object): def __init__(self, value): self.value = value class NoIndentEncoder(json.JSONEncoder): def __init__(self, *args, **kwargs): super(NoIndentEncoder, self).__init__(*args, **kwargs) self.kwargs = dict(kwargs) del self.kwargs['indent'] self._replacement_map = {} def default(self, o): if isinstance(o, NoIndent): key = uuid.uuid4().hex self._replacement_map[key] = json.dumps(o.value, **self.kwargs) return "@@%s@@" % (key,) else: return super(NoIndentEncoder, self).default(o) def encode(self, o): result = super(NoIndentEncoder, self).encode(o) for k, v in self._replacement_map.iteritems(): result = result.replace('"@@%s@@"' % (k,), v) return result

Ensuite ceci

obj = { "layer1": { "layer2": { "layer3_2": "string", "layer3_1": NoIndent([{"y": 7, "x": 1}, {"y": 4, "x": 0}, {"y": 3, "x": 5}, {"y": 9, "x": 6}]) } } } print json.dumps(obj, indent=2, cls=NoIndentEncoder)

produit la sortie suivante :

{ "layer1": { "layer2": { "layer3_2": "string", "layer3_1": [{"y": 7, "x": 1}, {"y": 4, "x": 0}, {"y": 3, "x": 5}, {"y": 9, "x": 6}] } } }

Il passe également correctement toutes les options (sauf indent) par exemple sort_keys=True Jusqu'à l'appel json.dumps Imbriqué.

obj = { "layer1": { "layer2": { "layer3_1": NoIndent([{"y": 7, "x": 1, }, {"y": 4, "x": 0}, {"y": 3, "x": 5, }, {"y": 9, "x": 6}]), "layer3_2": "string", } } } print json.dumps(obj, indent=2, sort_keys=True, cls=NoIndentEncoder)

correctement sorties :

{ "layer1": { "layer2": { "layer3_1": [{"x": 1, "y": 7}, {"x": 0, "y": 4}, {"x": 5, "y": 3}, {"x": 6, "y": 9}], "layer3_2": "string" } } }

Il peut également être combiné avec par ex. collections.OrderedDict:

obj = { "layer1": { "layer2": { "layer3_2": "string", "layer3_3": NoIndent(OrderedDict([("b", 1), ("a", 2)])) } } } print json.dumps(obj, indent=2, cls=NoIndentEncoder)

sorties :

{ "layer1": { "layer2": { "layer3_3": {"b": 1, "a": 2}, "layer3_2": "string" } } }

SzieberthAdam · Answer

Cela donne le résultat attendu du PO:

import json class MyJSONEncoder(json.JSONEncoder): def iterencode(self, o, _one_shot=False): list_lvl = 0 for s in super(MyJSONEncoder, self).iterencode(o, _one_shot=_one_shot): if s.startswith('['): list_lvl += 1 s = s.replace('
', '').rstrip() Elif 0 < list_lvl: s = s.replace('
', '').rstrip() if s and s[-1] == ',': s = s[:-1] + self.item_separator Elif s and s[-1] == ':': s = s[:-1] + self.key_separator if s.endswith(']'): list_lvl -= 1 yield s o = { "layer1":{ "layer2":{ "layer3_1":[{"y":7,"x":1},{"y":4,"x":0},{"y":3,"x":5},{"y":9,"x":6}], "layer3_2":"string", "layer3_3":["aaa
bbb","ccc
ddd",{"aaa
bbb":"ccc
ddd"}], "layer3_4":"aaa
bbb", } } } jsonstr = json.dumps(o, indent=2, separators=(',', ':'), sort_keys=True, cls=MyJSONEncoder) print(jsonstr) o2 = json.loads(jsonstr) print('identical objects: {}'.format((o == o2)))

jfs · Answer

Tu pourrais essayer:

marquez les listes qui ne devraient pas être mises en retrait en les remplaçant par NoIndentList:
```
class NoIndentList(list): pass 
```
remplacer méthode json.Encoder.default pour produire une représentation sous forme de chaîne non indentée pour NoIndentList.

Vous pouvez simplement le restituer à la liste et appeler json.dumps () sans indent pour obtenir une seule ligne

Il semble que l'approche ci-dessus ne fonctionne pas pour le module json:

import json import sys class NoIndent(object): def __init__(self, value): self.value = value def default(o, encoder=json.JSONEncoder()): if isinstance(o, NoIndent): return json.dumps(o.value) return encoder.default(o) L = [dict(x=x, y=y) for x in range(1) for y in range(2)] obj = [NoIndent(L), L] json.dump(obj, sys.stdout, default=default, indent=4)

Il produit une sortie non valide (la liste est sérialisée sous forme de chaîne):

[ "[{\"y\": 0, \"x\": 0}, {\"y\": 1, \"x\": 0}]", [ { "y": 0, "x": 0 }, { "y": 1, "x": 0 } ] ]

Si vous pouvez utiliser yaml alors la méthode fonctionne:

import sys import yaml class NoIndentList(list): pass def noindent_list_presenter(dumper, data): return dumper.represent_sequence(u'tag:yaml.org,2002:seq', data, flow_style=True) yaml.add_representer(NoIndentList, noindent_list_presenter) obj = [ [dict(x=x, y=y) for x in range(2) for y in range(1)], [dict(x=x, y=y) for x in range(1) for y in range(2)], ] obj[0] = NoIndentList(obj[0]) yaml.dump(obj, stream=sys.stdout, indent=4)

Cela produit:

- [{x: 0, y: 0}, {x: 1, y: 0}] - - {x: 0, y: 0} - {x: 0, y: 1}

c'est-à-dire que la première liste est sérialisée en utilisant [] et tous les éléments sont sur une seule ligne, la deuxième liste utilise une ligne par élément.

robm · Answer

Voici une solution de post-traitement si vous avez trop de types d'objets différents contribuant au JSON pour essayer la méthode JSONEncoder et trop de types différents pour utiliser une expression régulière. Cette fonction réduit les espaces blancs après un niveau spécifié, sans avoir besoin de connaître les spécificités des données elles-mêmes.

def collapse_json(text, indent=12): """Compacts a string of json data by collapsing whitespace after the specified indent level NOTE: will not produce correct results when indent level is not a multiple of the json indent level """ initial = " " * indent out = [] # final json output sublevel = [] # accumulation list for sublevel entries pending = None # holder for consecutive entries at exact indent level for line in text.splitlines(): if line.startswith(initial): if line[indent] == " ": # found a line indented further than the indent level, so add # it to the sublevel list if pending: # the first item in the sublevel will be the pending item # that was the previous line in the json sublevel.append(pending) pending = None item = line.strip() sublevel.append(item) if item.endswith(","): sublevel.append(" ") Elif sublevel: # found a line at the exact indent level *and* we have sublevel # items. This means the sublevel items have come to an end sublevel.append(line.strip()) out.append("".join(sublevel)) sublevel = [] else: # found a line at the exact indent level but no items indented # further, so possibly start a new sub-level if pending: # if there is already a pending item, it means that # consecutive entries in the json had the exact same # indentation and that last pending item was not the start # of a new sublevel. out.append(pending) pending = line.rstrip() else: if pending: # it's possible that an item will be pending but not added to # the output yet, so make sure it's not forgotten. out.append(pending) pending = None if sublevel: out.append("".join(sublevel)) out.append(line) return "
".join(out)

Par exemple, en utilisant cette structure comme entrée dans json.dumps avec un niveau de retrait de 4:

text = json.dumps({"zero": ["first", {"second": 2, "third": 3, "fourth": 4, "items": [[1,2,3,4], [5,6,7,8], 9, 10, [11, [12, [13, [14, 15]]]]]}]}, indent=4)

voici la sortie de la fonction à différents niveaux de retrait:

>>> print collapse_json(text, indent=0) {"zero": ["first", {"items": [[1, 2, 3, 4], [5, 6, 7, 8], 9, 10, [11, [12, [13, [14, 15]]]]], "second": 2, "fourth": 4, "third": 3}]} >>> print collapse_json(text, indent=4) { "zero": ["first", {"items": [[1, 2, 3, 4], [5, 6, 7, 8], 9, 10, [11, [12, [13, [14, 15]]]]], "second": 2, "fourth": 4, "third": 3}] } >>> print collapse_json(text, indent=8) { "zero": [ "first", {"items": [[1, 2, 3, 4], [5, 6, 7, 8], 9, 10, [11, [12, [13, [14, 15]]]]], "second": 2, "fourth": 4, "third": 3} ] } >>> print collapse_json(text, indent=12) { "zero": [ "first", { "items": [[1, 2, 3, 4], [5, 6, 7, 8], 9, 10, [11, [12, [13, [14, 15]]]]], "second": 2, "fourth": 4, "third": 3 } ] } >>> print collapse_json(text, indent=16) { "zero": [ "first", { "items": [ [1, 2, 3, 4], [5, 6, 7, 8], 9, 10, [11, [12, [13, [14, 15]]]] ], "second": 2, "fourth": 4, "third": 3 } ] }

Polv · Answer

En effet, YAML est meilleure que JSON.

Je ne peux pas faire fonctionner NoIndentEncoder ..., mais je peux utiliser l'expression régulière sur la chaîne JSON ...

def collapse_json(text, list_length=5): for length in range(list_length): re_pattern = r'$$' + (r'\s*(.+)\s*,' * length)[:-1] + r'$$' re_repl = r'[' + ''.join(r'\{}, '.format(i+1) for i in range(length))[:-2] + r']' text = re.sub(re_pattern, re_repl, text) return text

La question est de savoir comment procéder sur une liste imbriquée?

Avant:

[ 0, "any", [ 2, 3 ] ]

Après:

[0, "any", [2, 3]]

kashiraja · Answer

En guise de remarque, ce site Web dispose d'un JavaScript intégré qui évitera les sauts de ligne dans les chaînes JSON lorsque les lignes sont inférieures à 70 caractères:

http://www.csvjson.com/json_beautifier

(a été implémenté en utilisant une version modifiée de JSON-js )

Sélectionnez "Tableaux courts en ligne"

Idéal pour visualiser rapidement les données que vous avez dans le tampon de copie.