web-dev-qa-db-fra.com

Combien de caractères peuvent être stockés en 4Ko?

Combien de caractères puis-je stocker dans 4 Ko lorsque les caractères sont en encodage utf-8?

72
Pockata

En UTF-8, les caractères nécessitent entre 1 et 4 octets. Ainsi, vous pouvez stocker entre 4096 et 1024, respectivement, des caractères UTF-8 en 4Ko.

Je suppose que dans de nombreux cas d'utilisation, vous pouvez vous attendre à ce que la plupart des caractères tiennent dans un octet et presque tous dans 2.

97
MForster

Voici un indice visuel combien 1024 ou 4096 sont. Lisez le message de @Jon Snyder pour mieux comprendre.

1024 caractères (en supposant que les caractères ont 4 octets):

Lorem ipsum dolor assis amet, élit adipiscing consectetuer. Aenean commodo ligula eget dolor. Massa Énée. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nca, pellentesque eu, pretium quis, sem. Nulla conséquat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In en justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Tincidunt entier. Cras dapibus. Vivamus elementum sempre nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu, conséquat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a, tellus. Phasellus viverra nulla ut metus varius laoreet. Quisque rutrum. Imperdiet égéen. Etiam ultricies nisi vel augue. Curabitur ullamcorper ultricies nisi. Nam eget dui. Etiam rhoncus. Maecenas tempus, tellus eget condimentum rhoncus, sem quam sempre libero, sit amet adipiscing sem neque sed ipsum. Nam quam nunc, blandit ve

4096 caractères (en supposant que les caractères aient 1 octet):

Lorem ipsum dolor assis amet, élit adipiscing consectetuer. Aenean commodo ligula eget dolor. Massa Énée. Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Donec quam felis, ultricies nca, pellentesque eu, pretium quis, sem. Nulla conséquat massa quis enim. Donec pede justo, fringilla vel, aliquet nec, vulputate eget, arcu. In en justo, rhoncus ut, imperdiet a, venenatis vitae, justo. Nullam dictum felis eu pede mollis pretium. Tincidunt entier. Cras dapibus. Vivamus elementum sempre nisi. Aenean vulputate eleifend tellus. Aenean leo ligula, porttitor eu, conséquat vitae, eleifend ac, enim. Aliquam lorem ante, dapibus in, viverra quis, feugiat a, tellus. Phasellus viverra nulla ut metus varius laoreet. Quisque rutrum. Imperdiet égéen. Etiam ultricies nisi vel augue. Curabitur ullamcorper ultricies nisi. Nam eget dui. Etiam rhoncus. Maecenas tempus, tellus eget condimentum rhoncus, sem quam sempre libero, sit amet adipiscing sem neque sed ipsum. Nam quam nunc, blandit vel, luctus pulvinar, hendrerit id, lorem. Maecenas nec odio et ante tincidunt tempus. Donec vitae sapien ut libero venenatis faucibus. Nullam quis ante. Etiam sit amet orci eget eros faucibus tincidunt. Duis leo. Sed fringilla mauris sit amet nibh. Donec sodales sagittis magna. Sed conséquat, leo eget bibendum sodales, augue velit cursus nunc, quis gravida magna mi a libero). Fusce vulputate eleifend sapien. Vestibulum purus quam, scelerisque ut, mollis sed, nonummy id, metus. Nullam accumsan lorem in dui. Cras ultricies mi eu turpis hendrerit fringilla. Vestibulum ante ipsum primis in faucibus orci luctus et actrilia posu Inu dui quis mi consectetuer lacinia. Nam pretium turpis et arcu. Duis arcu tortor, suscipit eget, imperdiet nec, imperdiet iaculis, ipsum. Sed aliquam ultrices mauris. Integer ante arcu, accumsan a, consectetuer eget , posuere ut, mauris. Praesent adipiscing. Phasellus ullamcorper ipsum rutrum nunc. Nunc nonummy metus. Vestibulum volutpat pretium libero. Cras id dui. Aenean ut eros et nisl sagittis vestibulum. Nullam nulla eros, ultricies sit amet, nonummi pede. Sed lectus. Donec mollis hendrerit ri sus. Phasellus nec sem in justo pellentesque facilisis. Etiam imperdiet imperdiet orci. Nunc nec neque. Phasellus leo dolor, tempus non, auctor et, hendrerit quis, nisi. Curabitur ligula sapien, tincidunt non, euismod vitae, posuere imperdiet, leo. Maecenas malesuada. Praesent congue erat at massa. Sed cursus turpis vitae tortor. Donec posuere vulputate arcu. Phasellus accumsan cursus velit. Vestibulum ante ipsum primis in faucibus orci luctus et ultrices posuere cubilia Curae; Sed aliquam , nisi quis porttitor congue, elit erat euismod orci, ac placerat dolor lectus quis orci. Phasellus consectetuer vestibulum elit. Aenean tellus metus, bibendum sed, posuere ac, mattis non, nunc. Vestibulum fringilla pede sit amet augue. In turpis. Pellentesque posu . Praesent turpis. Aenean posuere, tortor sed cursus feugiat, nunc augue blandit nunc, eu sollicitudin urna dolor sagittis lacus. Donec elit libero, sodales nec, volutpat a, suscipit non, turpis. Nullam sagittis. Suspendisse pulvinar, augue acuma sem libero volutpat nibh, nec pellentesque velit pede quis nunc. Vestibulum ante ipsum primis in faucibus orci luctus et ultrices posuere cubilia Curae; Fusce id purus. Ut varius tincidunt libero. Phasellus dolor. Maecenas vestibulum mollis diam. Pellen tesque ut neque. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. In dui magna, posuere eget, vestibulum et, tempor auctor, justo. In ac felis quis tortor malesuada pretium. Pellentesque auctor neque nec urna. Proin sapien ipsum, porta a, auctor quis, euismod ut, mi. Aenean viverra rhoncus pede. Pellentesque habitant morbi tristique senectus et netus et malesuada fames ac turpis egestas. Ut non enim eleifend felis pretium feugiat. Vivamus quis mi. Phasellus a est. Phasellus magna. Dans hac habitasse platea dictumst. Curabitur à lacus ac velit ornare lobortis. Cura

97
user1767754

Un caractère UTF-8 est de 1 à 4 octets, cela dépend donc du caractère que vous encodez. La majorité de l'anglais utilise 1 octet pour chaque caractère. D'autres langues occidentales utilisent 2 octets. Les caractères asiatiques peuvent utiliser 4 octets.

La réponse est donc de 1024 à 4096 selon les personnages. De plus, dans un environnement Windows, vous aurez peut-être besoin d'une nomenclature de 3 octets au début du document, ce qui réduira la quantité de caractères que vous pouvez insérer dans 4 Ko. Voir article wikipedia sur UTF-8 .

14
Jon Snyder