web-dev-qa-db-fra.com

décodage et encodage de la chaîne hébraïque en Python

J'essaie d'encoder et de décoder la chaîne hébraïque "שלום". Cependant, après l'encodage, je reçois du charabia:

>>> Word = "שלום"
>>> Word = Word.decode('UTF-8')
>>> Word
u'\u05e9\u05dc\u05d5\u05dd'
>>> print Word
שלום
>>> Word = Word.encode('UTF-8')
>>> Word
'\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d'
>>> print Word
׳©׳׳•׳

Comment dois-je le faire correctement?

Merci.

20
user1767774

Vous devrez vous assurer d'avoir le bon encodage dans votre environnement (Shell ou script). Si vous utilisez un script, incluez les éléments suivants:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

Pour vous assurer que votre environnement sait que vous utilisez UTF-8. Vous pouvez constater que votre terminal Shell n'acceptera que l'ASCII, alors assurez-vous qu'il est capable de prendre en charge UTF-8.

>>> Word = "שלום"
>>> Word
'\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d'
>>> print Word
שלום
>>> Word = Word.decode('UTF-8')
>>> Word
u'\u05e9\u05dc\u05d5\u05dd'
>>> print Word
שלום
>>> Word = Word.encode('UTF-8')
>>> Word
'\xd7\xa9\xd7\x9c\xd7\x95\xd7\x9d'
>>> print Word
שלום
>>>
19
jonhurlock