J'essaie d'encoder et de décoder la chaîne hébraïque "שלום". Cependant, après l'encodage, je reçois du charabia:
>>> Word = "שלום"
>>> Word = Word.decode('UTF-8')
>>> Word
u'\u05e9\u05dc\u05d5\u05dd'
>>> print Word
שלום
>>> Word = Word.encode('UTF-8')
>>> Word
'\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d'
>>> print Word
׳©׳׳•׳
Comment dois-je le faire correctement?
Merci.
Vous devrez vous assurer d'avoir le bon encodage dans votre environnement (Shell ou script). Si vous utilisez un script, incluez les éléments suivants:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
Pour vous assurer que votre environnement sait que vous utilisez UTF-8. Vous pouvez constater que votre terminal Shell n'acceptera que l'ASCII, alors assurez-vous qu'il est capable de prendre en charge UTF-8.
>>> Word = "שלום"
>>> Word
'\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d'
>>> print Word
שלום
>>> Word = Word.decode('UTF-8')
>>> Word
u'\u05e9\u05dc\u05d5\u05dd'
>>> print Word
שלום
>>> Word = Word.encode('UTF-8')
>>> Word
'\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d'
>>> print Word
שלום
>>>