ªþ¿ý¤T¡@¸U°ê½X°_·½»P½s½X

³o­Óªþ¿ý¨Ó»¡¤@»¡¸U°ê½X¡]Unicode¡^ªº°_·½¤Î¨ä½s½X¡C


ASCII ½X»P¤j¤­½X¡]Big5¡^

ASCII »P­¶½X

²Ä¤@³¹´¿´£¹L ASCII ½X¡]American Standard Code for Information Interchange¡A¬ü°ê¸ê°T¥æ´«¼Ð·Ç½X¡^¡A¬O¥Î¼Æ¦r¨Óªí¥Ü­^¤å¦r¥À¤Î²Å¸¹ªº¼Æ½X¡A¨Ò¦p¥Î 41h ¥Nªí¡uA¡v¡A42h ¥Nªí¡uB¡v¡K¡K31h ¥Nªí¡u1¡v¡A32h ¥Nªí¡u2¡v¡K¡K¡A³oùتº¡uh¡v¥Nªí¦¹¾ð¬°¤Q¤»¶i¦ì¡A³o¬O²Õ¦X»y¨¥ªí¥Ü¤Q¤»¶i¦ì¼Æ­Èªº¤è¦¡¡C

¹ï¼Ú¬ü°ê®aªº¤å¦r¨Ó»¡¡A¥u»Ý¬ù¤@¡B¨â¦Ê­Ó´N¤w¨¬°÷¡A³o¬O¦]¬°¥L­Ìªº¤å¦r³£¬O¥H¦r¥À«÷¦¨¡A¦Ó¨CºØ»y¨¥ªº¦r¥À­Ó¼Æ¤£¦h¡A¨Ò¦p­^¤å¦r¥À¥[¤W¤j¤p¼g¶È 52 ­Ó¡A¦pªG¦A¥[¤WªÅ¥Õ¡B¼ÐÂI²Å¸¹¡Bªü©Ô§B¼Æ¦rµ¥µ¥¡A¤£¶W¹L¤@¦Ê­Ó¡C¤@­Ó¦ì¤¸²Õ¡]byte¡^¦³ 8 ­Ó¦ì¤¸¡A¥i¥Hªí¥Ü 0¡ã255 ¤§¶¡ªº¼Æ­È¡A¤]´N¬O»¡¥i¥Hªí¥Ü 256 ºØ¡]28=256¡^¤£¦Pªº¼Æ¦r¡A­Y¤@­Ó¼Æªí¥Ü¤@­Ó¦r¥À©Î²Å¸¹¡A¨º»ò ASCII ½X¥Î¤@­Ó¦ì¤¸²Õªºªø«×´N¤w¸g°÷¤F¡C«á¨Ó¦b¨î©w ASCII ®É¡AªG¯u¥H 7 ­Ó¦ì¤¸ªí¥Ü¡A³Ì°ª¦ì¤¸¥²¬° 0¡C

«á¨Ó¦³³\¦h¤H«K·Q¡A°²¦p³Ì°ª¦ì¤¸¤]¯à¨Ï¥Î¡A¤£¬O¤S¦h¥X¤F 128 ­Ó¦r¤¸©Î²Å¸¹¤F¡H©Ò¥H IBM ±À¥X PC¡þXT ®É¡A§â ASCII ÂX¥R¬° 8 ­Ó¦ì¤¸¼e¡A§Y¬°¤@­Ó¦ì¤¸²Õªº¤j¤p¡A±q 80h¡ã0FFh ªº ASCII ½X¬O¤@¨Ç²Å¸¹¡B­µ¼Ð¡B®Ø½u¡C¦Ó¨ä¥L¦a°Ï¨Ï¥Îªº»y¨¥¤£¦P¡A©Ò¥H¦U¦a°Ï ASCII ½X©w¸q 7Fh¡ã0FFh ªº²Å¸¹¤]¤£¦P¡A¬Æ¦Ü¦P¤@¦a°Ï¡A¦U¤j¤½¥q¤]¥i¨î©w¤£¦Pªº½s½X¡C©ó¬O³y¦¨ ASCII ½X¥Ñ 0¡ã7Fh ªº 128 ­Ó¦r¤¸¬O¼Ð·Çªº¡A³q¥Î©ó¥þ²y¡F80h¡ã0FFh «o«Ü²V¶Ã¡A§Y¨Ï¦P¤@¦a°Ï¡A¤]¥¼¥²¬Û¦P¡C«á¨Ó¥Ñ¬ü°ê°ê®a¼Ð·Ç¾Ç·| ( American National Standards Institute¡A²ºÙ ANSI ) ¥X­±¡A§â¦U¦a°Ï¨î©w²Î¤@ªº²Å¸¹¡AºÙ¤§¬°¡u­¶½X¡v( code page )¡C©³¤U¬OµØ¤H¦a°Ï±`¥Îªº­¶½X¡G

°ê®a»y¤å­¶½X
¤¤µØ¥Á°ê¥¿Å餤¤å950
¤¤µØ¤H¥Á¦@©M°ê²Å餤¤å936
¤é¥»¤é¤å932

¦P¤@­¶½Xªº ASCII ½X¡A¤£ºÞ¬O 0¡ã7Fh¡AÁÙ¬O 80h¡ã0FFh¡A³£¬O¬Û¦Pªº¡C¦pªG»Ý­n®É¡A¤]¥i¥H¤Á´«­¶½X¡A´N¥i¥H¨Ï¥Î§OºØ»y¨¥¤å¦r¡C¹³ ASCII ³oºØ¨t²Î¡A§Ú­ÌºÙ¤§¬°¡u³æ¦ì¤¸²Õ½s½X¨t²Î¡v¡]SBCS¡ASingle Byte Code System¡C¤]¦³¤HºÙ¬°¡u³æ¦ì¤¸²Õ¦r¶°¡v¡ASingle Byte Character Set¡^¡C¦ý¹ï©ó¤¤¤å¡A´N¶û¤£°÷¤F¡C§Y¨Ï¬O±`¥Îªº¤¤¤å¦r¡A«O¦u¦ô­p¤]¦³¼Æ¤d­Ó¡A¦]¦¹±o¥Î¨â ­Ó¦ì¤¸²Õ¨Óªí¥Ü¤å¦r¡A2 ­Ó¦ì¤¸²Õ¦@¦³ 16 ­Ó¦ì¤¸¡A³Ì¦h¥i¥Hªí¥Ü 216¡A¥ç§Y 65536 ­Ó¼Æ¡A¤]´N¬O»¡³Ì¦h¯àªí¥Ü 65536 ­Ó¤¤¤å¦r¡C¹³³oºØ¥H 2 ­Ó¦ì¤¸²Õ½s½Xªº¤è¦¡ºÙ¬°¡uÂù¦ì¤¸²Õ½s½X¨t²Î¡v¡]DBCS¡ADouble Byte Code System¡A¤]¦³¤HºÙ¬°¡uÂù¦ì¤¸²Õ¦r¶°¡v¡ADouble Byte Character Set¡^¡C

Big5 ½X»P­Ê¤Ñ¤¤¤å¨t²Î

¦­´Á¤¤¤å¹q¸£µo®i®É¡A¨Ã¨S¦³±j¦Ó¦³¤Oªº¼Ð·Ç½s½X¡A©Ò¥H³y¦¨¨C¤@®a¤½¥q©Î¾÷ºc©Òµo®iªº½s½X¤£¦P¦Ó¤£¬Û®e¡C¨ì¤F¥Á°ê 73 ¦~¡A¥Ñ¤¤µØ¥Á°ê°]¹Îªk¤H¸ê°T¤u·~µ¦¶i·|¥D¾É¡A©M¤­¶¡¹q¸£¤½¥q¡]§»ùÖ¡B¯«³q¡B¨Î¨Î¡B¹s³ü¤Î¤j²³¡^¦@¦Pµo®i¤@®M¤¤¤åªº½s½X¨t²Î¡C³o¤­®a¹q¸£¤½¥q¦b·í®É¬O¼Æ¤@¼Æ¤Gªº¤j¤½¥q¡A¨ä¼vÅT¤O¥i¿×Á|¨¬»´­«¡A¦Ó¥L­Ì©Òµo®iªº½s½X¨t²Î´NºÙ¬°¤j¤­½X¡]¥ç¥iºÙ¤­¤j½X¡A­^¤å¬O Big5¡A³o¬O°ê®aµo®iµo®i©e­û·|Àɮ׺޲z§½ªº»¡ªk¡C¥t¤@»¡¬O¬°¤Fµo®i¤­ºØ­«­nªº®M³nÅé¶i¦Ó«P¦¨ Big5 ªº¨î©w¡A¸Ô±¡¨£¦³Ãö¥þ¦r®wªº»¡©ú¡C¡^

¥Ñ©ó¤j¤­½Xªº½Ï¥Í¡A¨Ï±o¤¤¤å½s½X¦³¨Ì´`ªº¼Ð·Ç¡A¥¦³Ì¤jªºÀu¶Õ¦b©ó»P ASCII ½X¬Û®e¡C³o·N«ä¬O»¡¡A¥H Big5 ½s½Xªº¤å¥ó¤¤¡A¥i¥H¥¿½Tªº³B²z¤¤¤å»P­^¤å¡C«á¨Ó¦b DOS ¨t²Î¤¤ªº­Ê¤Ñ¤¤¤å¡AWindows 3.1 ¥H¤Î Windows 95/98/Me ³£¥ý«á±Ä¥Î³o®M½s½X¨Ó³B²z¥¿Å餤¤å¡C¦ý¬O Big5 ½X©Ò¦¬¿ýªº¦r¤Ó¤Ö¡A³\¦h¤H¦W¡B¦a¦W¨Ã¨S¦³¥]¬A¦b¤º¡A«á¨Ó¦³³\¦h¾÷ºc¦b Big5 ªº°ò¦¤W¥[¥HÂX¥R¡C¦b¥Á°ê¤K¤Q¦~¥N¦Ü¤E¤Q¦~¥N¡A¨Ï¥Î¥¿Å餤¤åªº°ê®a©Î¦a°Ï¡A¹³¤¤µØ¥Á°ê¡B­»´ä¡B·s¥[©Y¥H¤Î®ü¥~µØ¤Hªº¤¤¤å¹q¸£¡A³£¨Ï¥Î Big5 ½X¡C

¦b DOS §@·~¨t²Î¤U°õ¦æªº­Ê¤Ñ¤¤¤å«á¡A·|±`¾n©ó°O¾ÐÅéùØ¡C­Ê¤Ñ¤¤¤åÅã¥Ü¤å¦rªº­ì²z»P­^¤åÃþ¦ü¡A½Ð°Ñ¦Ò DOS ²Õ¦X»y¨¥²Ä¤Q¤T³¹Åã¥Ü°O¾ÐÅ骺»¡©ú¡A§â­nÅã¥Üªº¦r¤¸©Ò¥Nªíªº¼Æ­È¦s¤Jµø°T°O¾ÐÅ餺¡A´N¥i¥HÅã¥Ü¸Ó¦r¤¸¡C¦b¯u¹ê¼Ò¦¡©³¤U°õ¦æªº DOS¡Aµø°T°O¾ÐÅé°_©l©ó B800:0000¡A°¸¼Æ¦ì§}¬O¦s©ñ¦r¤¸©Ò¥Nªíªº¼Æ­È¡A©_¼Æ¦ì§}¬O¦s©ñÃC¦â¡C¨Ò¦p¦b¿Ã¹õ¤W¥ª¤W¨¤Åã¥Üºñ¦â¡]2 ªí¥Ü¶Â©³ºñ¦r¡^ªº¡u§Ú¾Ç ASSEMBLY¡C¡v¦r¦ê¡A¨º»ò¥Î DEBUG.EXE Æ[¹î¦ì§} B800:0000¡A±z·|¬Ý¨£¤U¹Ï¡G

¦b°O¾ÐÅé¦ì§} B800:0000 »P B800:0002 ³Bªº¤º®e¤À§O¬O A7 »P DA¡A¥¦­Ì³£¬O¤Q¤»¶i¬°¼Æ­È¡A¥H¥Õ¦â¼Ð°_¨Ó¡A²Õ¦X°_¨Ó¬O A7DA¡A³o¬O Big5 ½X¡A¥Nªí¡u§Ú¡v¡A¦pªG¤£«H¡A¥i¥H¬d¾\¥þ¦r®wÅçÃÒ¡C¤ñ°¸¼Æ¦ì§}°ª¤@­Ó¦ì¤¸²Õªº¦ì§}¤W¡A¦s©ñ³o¬O¸Ó¦r¤¸ªºÃC¦â»P­I´º¦â¡C°²³]§â B800:0001 §ï¦¨ 4¡]4 ¥Nªí¶Â©³¬õ¦r¡A¦p¤U¹Ï¥Õ¦â®Ø¡^¡A±z´N·|¬Ý¨£¡u§Ú¡v¦rªº¥ª¥b³¡Åܬõ¦â¡A¥k¥b³¡¤´¬Oºñ¦â¡G ¨ä¾lªº¦r¤¸³£¬O¦p¦¹¦w±Æ¡A®t§O¦b©ó¤¤¤å¦r»Ý¦û¥Î¨â­Ó¦ì¤¸²Õ¡A­^¤å¦r¶È¤@­Ó¦ì¤¸²Õ¡A¨Ò¦p BEC7 ©M A143 ¤À§O¬O¡u¾Ç¡v©M¡u¡C¡vªº Big5 ½X¡A¦Ó­^¤å¦r¡uAssembly¡v¨C­Ó¦r¥À¶È¥e¤@­Ó¦ì¤¸²Õ¡C¦Ü©ó¤å¦rªºªºÃC¦â¸¹½X¡]°Ñ¦Ò DOS ²Õ¦X»y¨¥²Ä¤Q¤T³¹¡^¡C

¦³Ãö Big5 ÁÙ¦³¤@ÂI­È±o¤@´£¡ABig5 ½X¦b°O¾ÐÅ餤ªº±Æ¦C¤è¦¡¬O¤jºÝ§Ç¡]big-endian¡^¡A³oºØ±Æ¦C¤è¦¡«ê¦n»P IBM PC ¤Î¨ä¬Û®e¹q¸£ªº±Æ¦C¤è¦¡¤£¦P¡A³oÂI«Ü©_©Ç¡A¬°¦ó¦p¦¹©O¡H­n¦^µª³o­Ó°ÝÃD¡A±o¥ý»¡©ú Big5 ¤Î ASCII ªº½s½X½d³ò¡GBig5 °ª¦ì¤¸²Õªº½d³ò¬O 81h¡ã0FEh¡A¦Ó§C¦ì¤¸²Õ¬O 40¡ã7Eh ©Î 80¡ã0FEh¡F¦Ó ASCII ªº½d³ò¬O 00¡ã7Fh¡C

¦pªG·Ó¤jºÝ§Ç±Æ¦C¡A¤@¶}©lªº²Ä¤@­Ó¦ì¤¸²Õ¤p©ó 80h ´Nª¾¹D¦¹¬° ASCII ¦r¤¸¡F§_«h´N¬O Big5 ¦r¤¸¡A¥²¶·»P¤U¤@¦ì¤¸²Õ¦X°_¨Ó¤~¬O¤@­Ó§¹¾ãªº¤¤¤å¦r¡C¤Ï¹L¨Ó¡A¦pªG·Ó¤pºÝ§Ç±Æ¦C¡A·í²Ä¤@­Ó¦ì¤¸²Õ¤p©ó 80h ®É¡A¦³¥i¯à¬O ASCII ¦r¤¸¡A¤]¦³¥i¯à¬O Big5 ªº§C¦ì¤¸²Õ¡A©Ò¥H¨Æ¹ê¤W¤£½×¬O§_¤p©ó 80h¡A³£¥²¶·­nÀˬd¤U¤@­Ó¦ì¤¸²Õ¡A¦Ó¥B³o¤U¤@­Ó¦ì¤¸²Õ¶·¦b 81¡ãFE ¤§¶¡¤~¬O Big5 ½X¡A³o¨â­Ó¦ì¤¸²Õ¦X°_¨Ó¬° Big5 ¦r¤¸¡F­Y¤£¦b 81¡ãFE ¤§¶¡¨º»ò²Ä¤@­Ó¦ì¤¸²Õ¬O ASCII ¦r¤¸¡C¤ñ¸û°_¨Ó¡A«áªÌÅãµM¤ñ¸û³Â·Ð¡C

¨Ò¦p¹q¸£­nÅã¥Ü©³¤U³o¥y¸Ü¡uHuman being ¬O¤HÃþ¡C¡v¡C¦b°O¾ÐÅ餤¡A°²³] Big5 ¬O¨Ì¾Ú¤jºÝ§Ç±Æ¦C¡G

48 75 6d 61 6e 20 62 65 69 6e 67 20 ac 4f a4 48 c3 fe a1 43

·í¹q¸£¥Ñ¦¹¦r¦ê¶}©l¡AŪ¨ú²Ä¤@­Ó¦ì¤¸²Õµo²{¬O 48h¡A¤p©ó 80h ©Ò¥H¬O ASCII ¦r¤¸¡A´N¥h°õ¦æÅã¥Ü­^¤åªºµ{¦¡½X¡CµM«áŪ¨ú²Ä¤G­Ó¦ì¤¸²Õ¡Aµo²{¤]¬O ASCII ¦r¤¸¡A¡K¡K¦p¦¹ª½¨ì¥Õ¦â¦r¡Aµo²{¬O 0ACh¡A¨º»ò´N¬O Big5 ½X¡A³o®É­n¦AŪ¨ú¤U¤@­Ó¦ì¤¸²ÕÅܦ¨ 0AC4Fh¡AµM«á°õ¦æÅã¥Ü¤¤¤å¦rªºµ{¦¡½X¡C

¦P¼Ëªº±¡ªp¡A°²³]¨Ì¾Ú¤pºÝ§Ç±Æ¦C¡A¦b°O¾ÐÅ餤¬O¡G

48 75 6d 61 6e 20 62 65 69 6e 67 20 4f ac 48 a4 fe c3 43 a1

­n§PÂ_²Ä¤@­Ó¦ì¤¸²Õ¬O ASCII ¦r¤¸ÁÙ¬O Big5 ¦r¤¸¡A¶·§PÂ_²Ä¤G­Ó¦ì¤¸²Õ¬O§_¦b 81¡ãFE ¤§¶¡¡A75h ¤£¦b¦¹½d³ò¤º¡A©Ò¥H²Ä¤@­Ó¦ì¤¸²Õ¬O ASCII ¦r¤¸¡A°õ¦æÅã¥Ü ASCII ¦r¤¸ªºµ{¦¡½X¡C±µ¤U¨Ó­n§PÂ_²Ä¤G­Ó¦ì¤¸²Õ»ÝŪ¨ú²Ä¤T­Ó¦ì¤¸²Õ¡A¨Ì«e­z¤èªk¡K¡K¦p¦¹ª½¨ìµµ¦â¦r¡Cµo²{µµ¦â¦rªº²Ä¤G­Ó¦ì¤¸²Õ¬O 0ACh¡A¦b 81¡ã0FEh ¤§¶¡¡A©Ò¥H»P«e¤@­Ó¦ì¤¸²Õ¦X°_¨Ó¡A0AC4Fh ¬O Big5 ¦r¤¸¡A°õ¦æÅã¥Ü Big5 ªºµ{¦¡¡CBig5 ½X¥H¤pºÝ§Ç±Æ¦C¡A¬O¤£¬O¤ñ¤jºÝ§Ç±Æ¦C³Â·Ð¤@¨Ç¡H·íµM¡A³o¥u¬O¤p¤ì°¸ªº²q´ú¡A¦ýÀ³¸Ó¬O¦p¦¹¡C


¸U°ê½X

°_·½

ÀHµÛºô»Úºô¸ôªºµo¹F¡A¹q¸£¤w¤£¬O¤@®y®yªº©t®q¡A±`±`»Ý­nÂǥѺô¸ô»P¥~¬É¬Û³s¡AŪ¨ú°ê¥~ªº¸ê®Æ¡A¦Ó³o¨Ç¸ê®Æ¤£¤@©w¬O¥»°ê»y¨¥¼g¦¨ªº¡A¤]¤£¤@©w¬O­^¤å¼g¦¨ªº¡A¦³¥i¯à¬O¤é¤å¡B®õ¤å¡Bªü©Ô§B¤å¡B«X¤å¡K¡Kµ¥µ¥¡A¬Æ¦Ü¦³®É­Ô¦b¦P¤@¥÷¤å¥ó¤¤¡A¥]§t¼ÆºØ¤å¦r¡C³o¼Ë´N¤£¯à¾a¤@ºØ»y¤å¤@ºØ½s½Xªº¤è¦¡¤F¡A¥²¶·µo®i¥Î¯à²[»\©Ò¦³»y¨¥ªº½s½X¤è¦¡¡C

¬°¤F¸Ñ¨M³o­ÓÃøÃD¡A¦Û¥Á°ê 73 ¦~¡]¦è¾ä 1984 ¦~¡^¡A¦³¨â­Ó²Õ´µÛ¤â¬ã¨s¦¹°ÝÃD¡C¨ä¤¤¤@­Ó¬O°ê»Ú¼Ð·Ç²Õ´¡]ISO¡AInternational Organization for Standardization¡^»PÁp¦X°ê¤UÄݪº°ê»Ú¹q®ð§Þ³N©e­û·|¡]IEC¡AInternational Electro-technical Commission¡^¦X²Õªº¤u§@¤p²Õ¡A¸Ó¤p²Õ¯óÀÀ´£¥Xªº ISO 10646 ¼Ð·Ç¯ó®×¡C¥t¤@­Ó²Õ´¬O¥Ñ IBM¡BDEC¡BSun¡BXerox¡BApple¡BMicroSoft¡BNovell ¤½¥q¡A¦@¦P¥X¸ê¦¨¥ßªº Unicode ¨ó·|¡A¸Ó¨ó·|³]¥ß«DÀç§Qªº Unicode ¤½¥q¡A¨Ã¥Ñ¸Ó¤½¥q³]­p¥X¾A¥Î¥þ²yªº Universal Code¡A²ºÙ Unicode¡C

ÁöµM¤@¶}©l¡A³o¨â­Ó²Õ´ªº¤u§@¬O¦U¦Ûµo®iªº¡A¦ý¬O³Ì«á¥L­Ì³£Åé»{¨ì³o¥@¬É¤£»Ý­n¨â®M½s½X¡A§_«h°Z¤£¬O¦A«×³´¤J·íªìªº§x¹Ò¡H©ó¬O¦b¥Á°ê 80 ¦~¥ª¥k¡A¥L­Ì¦X¨ÖÂù¤èªº¦¨ªG¡A³o´N¬O Unicode/ISO 10646¡A¤@¯ë¥i²ºÙ¬° Unicode¡A¤¤¤å¥i½Ķ¦¨¸U°ê½X©Î²Î¤@½X¡A¥¦¸¨¹ê¤F²Î¤@¥þ²y¤å¦r¥æ´«¡BÅã¥Ü¡BÀx¦s¡B¶Ç°e¼Ð·Çªº²z·Q¡C

­n§â¥þ²y©Ò¦³¤å¦r½s½X¡A¤£¬O¤@¥ó²³æªº¨Æ±¡¡C¾Ú¦ô­p¥þ¥@¬É¬ù¦³¤£¨ì¤C¤dºØ»y¨¥¡A¦ý¬O¦³¨Ç»y¨¥¥u¦³Án­µ¨S¦³¤å¦r¡A¦©°£³o¨Ç»y¨¥¡A¥uºâ¦³¤å¦rªº»y¨¥¬ù¦³¨â¤d¦hºØ¡C­n§â³o¨Ç»y¨¥ªº¨C­Ó¦r³£½s¦¨½X¤]¤£¬O²³æªº¤u§@¡A¦]¬°¨ì©³¦³¦h¤Ö­Ó¤å¦r©Î¦r¥À¡A½Ö¤]»¡¤£·Ç¡C¦b¥Á°ê 80 ¦~µoªí Unicode 1.0¡A¶È½s½X¤C¤d¦h¦r¡A³o­Óª©¥»¨Ã¨S¦³¥]§t¥@¬É¤W´XºØ­«­nªº»y¨¥¡A¨Ò¦p¤¤¤å¡B¤é¤å¡BÁú¤åµ¥¡C­n¨ì¥Á°ê 82 ¦~µoªíªº Unicode 1.1/ISO 10646-1 ¤~¥]§t³o¤TºØ»y¤åªº¤j³¡¤À¤å¦r¡C¤@ª½¨ì¥Á°ê 109 ¦~¡]¦è¾ä 2020 ¦~¡^¡A¤w¸gµo®i¨ì Unicode 13.0/10646:2020¡A¤w½s½X¤Q¥|¸U¦h­Ó¤å¦r¡A¦Ü¤µ¸U°ê½Xªº½s½X¤u§@¤´«ùÄò¶i¦æ¡C

ºîÆ[¤W­±ªº¾ú¥v¡A¸U°ê½X¬O¥Ñ¨â­Ó¾÷ºc©Î²Õ´¦X§@¨î­qªº¡A°ê»Ú¼Ð·Ç²Õ´»P Unicode ¤½¥q¡C¥L­Ìªº¦r¤¸½s½X¬O§¹¥þ¤@¼Ë¡A®t§O¦b©ó Unicode §ó¥[Ãöª`¹ê»ÚÀ³¥Î©M§Þ³N¤ä«ù¡A¨C¦~§ó·s¡F¦Ó ISO 10646 «hµÛ­«§@¬°°ê»Ú¼Ð·Ç´£¨Ñ°ò¦³W½d¡A§ó·s¸ûºC¡C¦]¬°¦³²Ó¤pªº®t§O¡A©Ò¥H¤W­±¤~·|¼g¦¨ Unicode 1.1/ISO 10646-1 ©M Unicode 13.0/10646:2020 ªº¼Ë¤l¡F¦ý¤]¥i¥H©¿²¤³o¨Ç®t§O¡Aª½±µ³æ¿W»¡ Unicode ©Î ISO 10646¡A½Ķ¦¨¤¤¤å´N»¡¬O¸U°ê½X©Î²Î¤@½X¡C

UCS¡Ð4

¦b ISO 10646 ùإΥ|­Ó¦ì¤¸²Õ¨Ó½s½X¡A¦]¦¹ºÙ¬° UCS¡Ð4¡AUCS ¬O Universal Multiple-Octet Coded Character Set ªºÁY¼g¡A·N¸q¬°¡u¦h­Ó¤K¦ì¤¸½s½Xªº¼s¥Î¤å¦r¶°¡v¡A4 ¥Nªí 4 ­Ó¦ì¤¸²Õ¡A³o¥|­Ó¦ì¤¸²Õ¨ä¹ê´N¬O¦h­Ó¤K¦ì¤¸ªº·N«ä¡CUCS¡Ð4 ¥i²z¸Ñ¬°¡u¥|­Ó¦ì¤¸²Õ½s½Xªº¼s¥Î¤å¦r¶°¡v¡C

UCS¡Ð4 ¨Ì¦ì¤¸²Õ°ª§C¦¸§Ç§â¨C¤@¦ì¤¸²ÕºÙ¬°¸s²Õ¡]group¡^¡B¦r­±¡]plane¡^¡B¦C¡]row¡^¡B®æ¡]cell¡^¡C¸s²Õªº³Ì°ª¦ì¤¸¤£¨Ï¥Î¡A¶È³Ñ¤C­Ó¦ì¤¸¡A¥Ñ 00h¡ã7Fh ¦@ 128 ­Ó¡A¥i¤À¦¨ 128 ¸s²Õ¡F¦¸°ª¦ì¤¸²Õ¥Nªí¦r­±¡A©Ò¥H¨C¤@¸s²Õ³£¦³ 256 ­Ó¦r­± ( 00¡ã0FFh )¡A¨C­Ó¦r­±¦³ 216¡A§Y 65536 ­ÓªÅ¶¡¥i®e¯Ç¤å¦r¡A¨C­Ó¤å¦r±o¦û¥Î¤@­ÓªÅ¶¡¡AºÙ¬°®æ©Î½X¦ì¡C¦ý ISO 10646 ³W©w³Ì«á¨â®æ¤£¥Î¡A©Ò¥H¨C­Ó¦r­±Åܦ¨ 65534 ­Ó¦r¡C¨Ì¾Ú³o­Ó³W«h¡A³Ì¦h¥i¥H§â 65534¡Ñ128¡Ñ256 ¡×2,147,418,112¡A¬ù¤G¤Q¤@»õ­Ó¤å¦r½s¦¨½X¡C

³o»ò¤jªº½s½XªÅ¶¡¡A¤w¸g¥i¥H®e¯Ç±q¥j¦Ü¤µªº©Ò¦³¤å¦r¡A¬Æ¦Ü¥]§t²{¦b¤w¤£¦A¨Ï¥Îªº¤å¦r¡A¹³¥j®J¤Î¸t®ÑÅé¡]Hieroglyph¡A¤]ºÙ¬°®J¤Î¶H§Î¤å¦r¡^µ¥µ¥¡C¦³Ãö¸s²Õ¡B¦r­±ªº»¡©ú¡A½Ð°Ñ¦Ò¹Ï¤T¡]¹Ï¤T¬O°Ñ¦Ò CNS11643 ¤¤¤å¥þ¦r®wø»s¦Ó¦¨¡^¡G

ºI¦Ü²{¦b¡]¥Á°ê 113 ¦~¡^¡A¤w½s½Xªº¦r­±¦@ 17 ­Ó¡A¦Ó¥B³£¦b²Ä 00 ¸s²Õªº«e­± 17 ­Ó¦r­±¡C³o¤Q¤C­Ó¦r­±¡A°£¤F°ò¥»¦h»y¤å¦r­±¤§¥~¡A¨ä¥L§¡¥iºÙ²Ä´X»²§U¦r­±¡C©³¤U²§ã»¡©ú¤w½s½Xªº¦r­±¡G

⑴¡B²Ä 00 ¦r­±¡A¤]ºÙ¬°°ò¥»¦h»y¤å¦r­±¡]Basic Multilingual Plane¡A²ºÙ BMP¡^¡A¦¹¦r­±Ån¬A¤F¥þ²y±`¥Îªº¤å¦r¡C¦b ISO 10646-1 µoªí®É¤À¬° A¡BI¡BO¡BR ¥|°Ï¡A«á¨Óªº 10646-1:1993 ·s¼W S °Ï¡A³o¤­°Ï¦p¤U¡G
⒜¡BA °Ï¡G¦b½d³ò 0000¡ã4DFF¡A¥i½s½X¦r¼Æ¦³ 19903¡C¥]§t¤U­±¤å¦r¡G
¡@¡@ⓐ¦b 0000¡ã007F ½d³òªº¬O­^¤å¦r¥À¡Bªü©Ô§B¼Æ¦rµ¥¡A³o»P ASCII ½X§¹¥þ¤@¼Ë¡A¨£¹Ï¤G①¡C
¡@¡@ⓑ¦b 0080¡ã2E7F ½d³òªº¬O³\¦h«÷­µ¤å¦r¡A¥]§t©Ô¤B¤å¡B§Æþ¤å¡Bªü©Ô§B¤åµ¥¡C
¡@¡@ⓒÂ\¦b 2E80¡ã33FF ¬O¤¤¤éÁú²Å¸¹°Ï¡A¹Ï¤Gªº②³B¡C¦¬®e±dº³¦r¨å³¡­º¡B¤¤¤éÁú»²§U³¡­º¡Bª`­µ²Å¸¹µ¥¡C
¡@¡@ⓓÂ\¦b 3400¡ã4DFF ¬°¤¤¤éÁú²Î¤@ªí·N¤å¦rÂX®i A °Ï¡A¨£¹Ï¤Gªº③¡C
⒝¡BI °Ï¡G¦b 4E00¡ã9FFF¡A¨£¹Ï¤G④¡A³o¬O¤¤¤éÁú²Î¤@ªí·N¤å¦r°Ï¡C
⒞¡BO °Ï¡G¦b A000¡ãD7FF¡A«O¯dµ¹¥¼¨Ó¨Ï¥Î¡A¦ý«á¨Ó³o¶ôªÅ¶¡¤]´X¥G¨Ï¥Î§¹²¦¡C
¡@¡@ⓐÂ\¦b A000¡ãA4CF ¬OÂU¤å¡A©ó¦è¤¸ 1999 ¦~¦¬¿ý©ó ISO 10646-1:2000¡C
¡@¡@ⓑ¦b A4D0¡ãD7FF ¤ºªº¬O¦Ñàôàô¤å¡B¥Ë¥ì»yµ¥¡C
⒟¡BS °Ï¡G¦b D800¡ãDFFF¡A¨£¹Ï¤G⑥¡A¨Ñ UTF¡Ð16 ¨Ï¥Î¡C
⒠¡BR °Ï¡G¦b E000¡ãFFFD¡A¨p¤H¨Ï¥Î°Ï¡C
⑵¡B²Ä 01 ¦r­±¡A¤]ºÙ¬°²Ä¤@»²§U¦r­±©Î¦h»y¤å¸É¥R¦r­±¡]Supplementary Multilingual Plane¡A²ºÙ SMP¡^¡A½d³ò¦b 00010000h¡ã0001FFFDh¡C¥D­n¬°²{®É¤w¤£¦A¨Ï¥Îªº¤å¦r¤Î²Å¸¹¡A¨Ò¦p¥j®J¤Îªº¸t®ÑÅé¦b 13000h¡ã1342Fh¡C¦¹¦r­±¤]Â\©ñ­µ¼Ö²Å¸¹¡Bªí±¡²Å¸¹¡B³Â±NµP¡]1F000¡ã1F02F¡^µ¥²Å¸¹©Î¤å¦r¡C
⑶¡B²Ä 02 ¦r­±¡A²Ä¤G»²§U¦r­±¡A¤SºÙ¬°ªí·N¤å¦r¸É¥R¦r­±¡]Supplementary Ideographic Plane¡A²ºÙ SIP¡^¡A¾ã­Ó½d³ò¦b 00020000¡ã0002FFFDh¡CÂ\©ñ¡u¤¤¤éÁú²Î¤@ªí·N¤å¦rÂX®i B °Ï¡v¡A¦@ 43253 ­Óº~¦r¡A¥H¤Î¤¤¤éÁú¬Û®eªí·N¤å¦r¼W¸É ( CJK Compatibility Ideographs Supplement )¡C³o¨Ç¤å¦r¥D­n±dº³¦r¨å¡Bº~»y¤j¦r¨å¬°°ò¦¡A¦©°£¤w½s¤J BMP ªº¤å¦r¡A¦A¥[¤W¦U°ê©Ò´£¦r¶°¡C
⑷¡B²Ä 03 ¦r­±¡A¤]ºÙ¬°²Ä¤Tªí·N¤å¦r¦r­±¡]Tertiary Ideographic Plane¡ATIP¡^¡A·s¼Wªºªí·N¤å¦r¡A¥D­n¥Î©óº~¦r¡C
⑸¡B²Ä 04 ¦r­±¡ã²Ä 13 ¦r­±¡A«O¯d¥¼¨Ó½s½X¨Ï¥Î¡C
⑹¡B²Ä 14 ¦r­±¡A¤]ºÙ¬°¯S®í¥Î³~¸É¥R¦r­±¡]Supplementary Special-purpose Plane¡A²ºÙ SSP¡^¡A¥Î©ó¼ÐÅÒ¤å¦r¤Î¯S®í¥Î³~ªº¤å¦r¡C
⑺¡B²Ä 15 ¦r­±¡ã²Ä 16 ¦r­±¡A¥çºÙ¬°¨p¤H¨Ï¥Î°Ï¡]Private Use Area¡A²ºÙ PUA¡^¡A¬O¨Ï¥ÎªÌ¦Û¤v­q©wªº°Ï°ì¡AµL¥þ²y¼Ð·Ç¡C

UCS¡Ð2

UCS¡Ð4 ¬O¥H¥|­Ó¦ì¤¸²Õ½s½X¡A¦P²z¡AUCS¡Ð2 ´N¬O¥H¨â­Ó¦ì¤¸²Õ½s½X¡C¬JµM¥H¨â­Ó¦ì¤¸²Õ½s½X¡A¨º´NµLªk¥]§t¥þ²y©Ò¦³ªº¤å¦r¡C¨Æ¹ê¤W¡A¥Î UCS¡Ð2 ½s½Xªº¦r¤¸¡A´N¬O°ò¥»¦h»y¤å¦r­±¤Wªº¤å¦r¡CÁöµMµLªk²[»\©Ò¦³ªº¤å¦r¡A¦ý¹ïµ´¤j³¡¤Àªº¤H¦bµ´¤j¦h¼Æªº±¡ªp¡AUCS¡Ð2 ¤w¯àº¡¨¬¤E¦¨¤Eªº»Ý¨D¡C¥t¥~¥¦ÁÙ¦³¤@­Ó«Ü¤jªºÀuÂI¡AUCS¡Ð2 ¥u¦³¨â­Ó¦ì¤¸²Õ¡A¤ñ°_ UCS¡Ð4 ­n¥e¥Î¥|­Ó¦ì¤¸²Õ¡A¥i»¡¬Û·í¸`¬ÙªÅ¶¡¡C


UTF¡Ð16 »P UTF¡Ð8

UTF¡Ð16

¦b»¡©ú UTF¡Ð16 ¬O¤°»ò¤§«e¡A¥ý«ä¦Ò¤@­Ó°ÝÃD¡C°²¦p¦³¤@­Ó 10000 ­Ó¦r¤¸ªºÀɮסA¨ä¤¤ 9990 ­Ó¦r¤¸³£¸¨¦b°ò¥»¦h»y¤å¦r­±¤W¡A´N¶È¦³ 10 ­Ó¦b»²§U¦r­±¤W¡C¦pªG¥Î UCS¡Ð4 Àx¦s³o¥÷Àɮ׻ݭn 40000 ­Ó¦ì¤¸²Õ¡A¥i·Q¦Óª¾¡A³o 40000 ­Ó¦ì¤¸²Õ´X¥G¦³¤@¥bªº¤º®e¬O¹s¡C¬°¤F¤Q­Ó¦r¤¸®ö¶O³o»ò¦hªÅ¶¡¡A«D±`¨S¦³®Ä²v¡C¦b¹ê°È¤W©Ò­±Á{ªº°ÝÃD¡A¸ò³o­Ó¨Ò¤l®t¤£¦h¡A¦]¬°±`¥Îªº¤å¦r³£¤w½s¦b°ò¥»¦h»y¤å¦r­±¤W¤F¡C¨º»ò¦³¨S¦³¿ìªk¸Ñ¨M®Ä²v¤£¹üªº°ÝÃD©O¡H

¨Æ¹ê¤W¡A¦bµoªí ISO 10646-1:1993 ®É¡A¯S§O³W©w¦b°ò¥»¦h»y¤å¦r­±¤ºªº¤å¦r¥i¥H¥Î¨â­Ó¦ì¤¸²Õªí¥Ü¡A¦b°ò¥»¦h»y¤å¦r­±¥H¥~ªº¤å¦r¥i¥HÂà´«¦¨¥|­Ó¦ì¤¸²Õªí¥Ü¡A³oºØªí¥Ü©ÎÂà´«¤è¦¡ºÙ¬° UTF¡Ð16¡AUTF ¬O UCS Transformation Format ªºÁY¼g¡A16 ¥Nªí 16 ¦ì¤¸¡C¦b²Õ¦X»y¨¥¤¤ 16 ¦ì¤¸¤]ºÙ¬°¦r²Õ¡]word¡^¡A¤@­Ó¦r²Õ¬Û·í©ó¨â­Ó¦ì¤¸²Õ¡CUTF¡Ð16 ¬O¥H¦r²Õ¬°³æ¦ì¡A¬GºÙ 16¡C

²{¦b¤w¸g¨Ï¥Îªº¦r­±¡A¥u¦³²Ä 00 ¸s²Õ«e¤Q¤C­Ó¦r­±¡A¦]¦¹¥u»Ý¦Ò¼{²Ä 00 ¸s²Õªº²Ä 00 ¦r­±¨ì²Ä 10h ¦r­±§Y¥i¡C¤]´N¬O»¡¡A¨ì¥Ø«e¬°¤î¡]¤¤µØ¥Á°ê 113 ¦~¡^¡A¸U°ê½X½s½X³Ì¦h¶È¨Ï¥Î¨ì 21 ¦ì¤¸¡A¥ç§Y±q 0 ¨ì 10FFFFh¡CUTF¡Ð16 ªºÂà´«¤è¦¡«K±Ä¥Î¤F¤@ºØ«ÜÁo©úªº°µªk¡A¥ý¦b°ò¥»¦h»y¤å¦r­±¤º©w¸q¥N²z°Ï¡]surrogate area¡A´N¬O¹Ï¤Gªº⑥¡AS °Ï¡^¡A±q 0D800h¡ã0DFFFh ³o¬q½d³ò¦@ 2048 ­Ó®æ¡A¨Ã¨S¦³©w¸q¦r¤¸¦Ó¬O´£¨Ñµ¹ UTF¡Ð16 ¤§¥Î¡CÂà´«¦¨ UTF¡Ð16 ªº¹Lµ{¦p¤U¡G

①¡B¦pªG¦r¤¸¦b°ò¥»¦h»y¤å¦r­±¤W¡A§â UCS¡Ð4 ªº°ª¦r²Õ°£¥h¡A¯d¤Uªº§C¦r²Õ´N¬O³o­Ó¦r¤¸ªº UTF¡Ð16 ½X¡C¦p¤U¹Ï©Ò¥Ü¡A¹Ï¤¤ªº­^¤å¦r¥À»P§Æþ¦r¥À³£¥Nªí¤@­Ó¦ì¤¸¡A¤£¬O¹s´N¬O¤@¡C
§C¦r²Õ¡G
°ª¦r²Õ¡G
Åܦ¨
¦r²Õ¡G
②¡B¦pªG¦r¤¸¤£¦b°ò¥»¦h»y¤å¦r­±¤W¡A¨º»ò¸Ó¦r¤¸ªº UCS¡Ð4 ½X¦b 10000h¡ã10FFFFh ¤§¶¡¡A°Ñ¦Ò¤U¹Ï¡AÂà´«¨BÆJ¦p¤U¡G
⑴¡B­ì§C¦r²Õ²Ä 0¡ã9 ¦ì¤¸Âà´««á¤´¬O§C¦r²Õªº²Ä 0¡ã9 ¦ì¤¸¡]¨£¤U¹Ï¦ì¤¸ a¡ãj¡^¡C
⑵¡BÂà´««á§C¦r²Õªº²Ä 10¡ã15 ¦ì¤¸Åܬ° 110111¡]¨£¤U¹Ï²HÂŦâ¦r¡^¡C
⑶¡B­ì§C¦r²Õ²Ä 10¡ã15 ¦ì¤¸Åܬ°°ª¦r²Õªº 0¡ã5 ¦ì¤¸¡]¨£¤U¹Ï¦ì¤¸ £\¡ã£a¡^¡C
⑷¡B­ì°ª¦r²Õ²Ä 0¡ã4 ¦ì¤¸¡]£b¡ã£f¡^©Ò§Î¦¨ªº¤G¶i¦ì¼Æ´î¥h¤@¡A©Ò±o¤§®tÅܬ°Âà´««á°ª¦r²Õªº²Ä 6¡ã9 ¦ì¤¸¡]w¡ãz¡^¡C
⑸¡BÂà´««á°ª¦r²Õªº²Ä 10¡ã15 ¦ì¤¸Åܬ° 110110¡]¨£¤U¹Ï²HÂŦâ¦r¡^¡C
§C¦r²Õ¡G
°ª¦r²Õ¡G
Åܦ¨
§C¦r²Õ¡G
°ª¦r²Õ¡G

¸g¹L¤W­z»¡©ú¡A±oª¾¦pªG¦r¤¸³B©ó°ò¥»¦h»y¤å¦r­±¡A¸g¹L UTF¡Ð16 Âà´««á¥Ñ¨â­Ó¦r²Õ´î¤Ö¬°¤@­Ó¦r²Õ¡F¦Ó³B©ó»²§U¦r­±¤Wªº¤å¦r¡AÂà´««á¤´¬O¨â­Ó¦r²Õ¡C³o¼Ë¬Ý°_¨Ó¡A±Ä¥Î UTF¡Ð16 ½s½X¯à°÷¦³®Ä´î¤ÖÀɮתø«×¡A¤S¯àªí¥Ü¥þ²y»y¤åªº¤å¦r¡A¯u¬O¨â¥þ¨ä¬ü¡C¨º»ò¦pªG­n§â UTF¡Ð16 «ì´_¦¨ UCS¡Ð4 ©O¡H¨ä¹ê«Ü²³æ¡A¦pªG UTF¡Ð16 ¦b 0D800h¡ã0DFFFh ½d³ò¤º¡A´Nªí¥Ü¸Ó¦r¤¸¦b»²§U¦r­±¡AÀ³»P¤U¤@­Ó¦r²Õ¦X°_¨Ó¡F¦pªG¤£¦b³o­Ó½d³ò¤º´N¬O°ò¥»¦h»y¤å¦r­±¤Wªº¤å¦r¡A¥u»Ý¼W¥[¤@­Ó°ª¦r²Õ¡A¥B³o­Ó¼W¥[ªº°ª¦r²Õ¬°¹s¡A´NÅܦ¨ UCS¡Ð4¡C

ÁA¸Ñ¤F­ì²z¤§«á¡A©³¤UÁ|­Ó¨Ò¤l»¡©ú¦p¦ó§â»²§U¦r­±ªº¤å¦r¡AÂà´«¦¨ UTF¡Ð16¡C¨Ò¦p¡u炭¡v¦rªº¸U°ê½X¬O 2F91Ah¡A¦bªí·N¤å¦r¸É¥R¦r­±¡]²Ä¤G»²§U¦r­±¡^¡A­º¥ý§â¥¦Åܬ°¤G¶i¦ì¡G

2F91Ah¡×0010 1111 1001 0001 1010b

¥Õ¦âªº³¡¤À¬O§C¦r²Õªº 0¡ã9 ¦ì¤¸¡A¦A¥[¤W 110 111¡AÂà´««áªº§C¦r²Õ¬O¡u1101 1101 0001 1010¡v¡A´«¦¨¤Q¤»¶i¦ì¬O¡u0DD1Ah¡v¡CÂà´««áªº°ª¦r²Õ²Ä 0¡ã5 ¦ì¤¸¬Oµµ¬õ¦â¦r¡A¤]´N¬O 11 1110¡F¦Ó 6¡ã9 ¦ì¤¸«h¬O¶À¦â¦r´î¤@¡A¤]´N¬O 0010¡Ð1¡×0001¡F²Ä 10¡ã15 ¦ì¤¸¬° 110 110¡A²Õ¦X°_¨Ó°ª¦r²Õ¬°¡u1101 1000 0111 1110¡v¡AÅܦ¨¤Q¤»¶i¦ì¬O¡u0D87Eh¡v¡Cµ²½×¬O¡u炭¡v¦rªº¸U°ê½X¬O 2F91Ah¡AÂà´«¦¨ UTF¡Ð16 ¬°¡u0D87E 0DD1Ah¡v¡C

¦b»¡©ú¤F UTF¡Ð16 ½s½X¤è¦¡¤§«á¡A»P UCS¡Ð2 ¤ñ¸û¡AÀ³¥i±o¨ì©³¤Uªºµ²½×¡G①UTF¡Ð16 ¯àªí¥Ü©Ò¦³¦r¤¸¡AUCS¡Ð2 ¥u¯àªí¥Ü¦ì©ó°ò¥»¦h»y¤å¦r­±¤Wªº¦r¤¸¡C②¦bªí¥Ü°ò¥»¦h»y¤å¦r­±¤Wªº¦r¤¸®É¡A¥H UTF¡Ð16 ©Î¥H UCS¡Ð2 ¤è¦¡ªí¥Ü¡Aµ²ªG³£¬O¤@¼Ëªº¡C°ò©ó¥H¤W¨âÂI¡A¥i¥H»¡ UCS¡Ð2 ¬O UTF¡Ð16 ªº¤l¶°¡C

Windows 95/98/Me µ¥§@·~¨t²Î¶È¤ä´© ANSI ¦r¤¸¶°¡A¥H¤Î³¡¤À UCS¡Ð2¡Cµo¥¬ªº Windows NT 4.0 ¤ä´© UCS¡Ð2¡CWindows 2000 ¶}©l¤ä´© UTF¡Ð16¡A¦ý¦³¨Ç±±¨î¶µ¨Ã¤£¤ä´©¡C¨ì¤F Windows 7 ¥H¤Î§ó·sªº Windows §@·~¨t²Î¤w¸g¨}¦n¦a¤ä´©¤F UTF¡Ð16¡C

UTF¡Ð8

¦³¤F UTF¡Ð16 ¤§«á¡AÁöµM¯à¤j´T¼W¥[ÀÉ®×Àx¦s®Ä²v¡A¦ý¥@¬É¤W¤j³¡¤åÄm³£¥H­^»y§e²{¡C°²¦p¬Y¥÷ÀÉ®×¥u¦³­^»y¡A¨º»ò¥Î UTF¡Ð16 ¨ÓÀx¦sÀɮסAÁÙ¬O«D±`®ö¶O¡A©ó¬O ISO 10646 ¤]³W©w¤F UTF¡Ð8 Âà´«¤è¦¡¡C

UTF¡Ð8 Âà´«³W«h«Ü²³æ¡A¦pªG USC¡Ð4 ¦r¤¸¬Oµ¥©ó 7Fh ©Î¤p©ó 7Fh¡A«h¤£Âà´«ª½±µ¨ú³Ì§C¤K¦ì¤¸´N¬O UTF¡Ð8 ½X¡C¦pªG¶W¹L 7Fh ®É¡A«hÂà´«¦¨¼Æ­Ó¦ì¤¸²Õ¡A²Ä¤@­Ó¦ì¤¸²Õ«e­±¦³´X­Ó 1¡A´N¥NªíÂà´««á¦³´X­Ó¦ì¤¸²Õ¡A¤§«á±µ¤W¤@­Ó 0¡AµM«á±q­ì¨Óªº UCS¡Ð4 ¶}©l³v¤@§â¦ì¤¸¥Ñ°ª¦Ó§C¶ñ¤J¡Aª½¨ìº¡¤F 8 ­Ó¦ì¤¸¡CÂà´««áªº²Ä¤G­Ó¦ì¤¸²Õ¤Î¨ä¥H«á«e¦ì¤¸²Õ¡A²Ä¤»¡B¤C¨â­Ó¦ì¤¸¥²¬O 10¡AµM«á¨ä¾lªº 6 ­Ó¦ì¤¸´N¬O³Ñ¾lªº UCS¡Ð4 ¦ì¤¸¨Ì¦¸¶ñ¤W¡C¤èªk¦p¤U¡G

UCS¡Ð4Âà´««eÂà´««á
00

7Fh
§C¦r²Õ¡G
°ª¦r²Õ¡G
²Ä¤@­Ó¦ì¤¸²Õ¡G
80h

7FFh
§C¦r²Õ¡G
°ª¦r²Õ¡G
²Ä¤@­Ó¦ì¤¸²Õ¡G
²Ä¤G­Ó¦ì¤¸²Õ¡G
800h

0FFFFh
§C¦r²Õ¡G
°ª¦r²Õ¡G
²Ä¤@­Ó¦ì¤¸²Õ¡G
²Ä¤G­Ó¦ì¤¸²Õ¡G
²Ä¤T­Ó¦ì¤¸²Õ¡G
10000h

1FFFFFh
§C¦r²Õ¡G
°ª¦r²Õ¡G
²Ä¤@­Ó¦ì¤¸²Õ¡G
²Ä¤G­Ó¦ì¤¸²Õ¡G
²Ä¤T­Ó¦ì¤¸²Õ¡G
²Ä¥|­Ó¦ì¤¸²Õ¡G

¸U°ê½X¸g¹L UTF¡Ð8 Âà´««á¡AÅܦ¨¤@¨ì¥|­Ó¦ì¤¸²Õ¡A³o¨Ç¦ì¤¸²Õ¦s©ñ¦b°O¾ÐÅ骺¤è¦¡¬°²Ä¤@­Ó¦ì¤¸²Õ©ñ¦b³Ì§C¦ì§}¡A²Ä¤G­Ó¦ì¤¸²Õ©ñ¦b¦¸°ª¦ì§}¡K¡K³Ì«á¤@­Ó¦ì¤¸²Õ©ñ¦b³Ì°ª¦ì§}¡CUTF¡Ð8 Âà´«¨Ã¨S¦³¡uBig-Endian¡v©Î¡uLittle-Endian¡vªº°ÝÃD¡C

UTF¡Ð8 ÁÙ¦³´X­ÓÀuÂI¡C­º¥ý¡AASCII ¬O UTF¡Ð8 ªº¤l¶°¡AASCII ¦r¤¸¤£¶·¸gÂà´«´N¬O UTF¡Ð8¡C²Ä¤G¡A¹ï©ó¾ã½g³£¬O­^¤åªº¤å¥ó¦Ó¨¥¡A¨Ï¥Î UTF¡Ð8¡A¨C­Ó¦r¤¸³£¥e¥Î¤@­Ó¦ì¤¸²Õ¡A¯à¤j¤j´î¤ÖÀɮתø«×¡C²Ä¤T¡AÁöµM UTF¡Ð8 ¦r¤¸ªºªø«×¤£©T©w¡A¦ýÀ³¥Îµ{¦¡¯à¸g¥Ñ¤W­z UTF¡Ð8 ªºÂà´«³W«h¡A©ú½T±o¨ì¦r¤¸±q­þ­Ó¦ì¤¸²Õ¶}©l¡A¦ó³Bµ²§ô¡C¤j·§¦]¬°¦³³o¤T­ÓÀuÂI¡A²{¦bºô­¶¤Wªº HTML¡A¤E¦¨¥H¤W³£¥H UTF¡Ð8 Àx¦s¡C

©³¤UÁ|­Ó¨Ò¤l»¡©ú¦p¦ó§â UCS¡Ð4 Âà´«¦¨ UTF¡Ð8¡C¨Ò¦p¡u炭¡v¦rªº¸U°ê½X¬O 2F91Ah¡A°Ñ¦Ò¤WªíÂà´«¦¨¤G¶i¦ìÀ³¸Ó­n¦³¤G¤Q¤@¦ì¡A©Ò¥H±o¨ì

2F91Ah¡×0 0010 1111 1001 0001 1010b

¤W­±¥Õ¦âªº¤T­Ó 0¡A¬O¤Wªí¤¤ªº abc¡C2F91Ah ¦b 10000h¡ã1FFFFFh ¤§¶¡¡A©Ò¥HÂà´«¦¨ UTF¡Ð8 ¤§«á¦³¥|­Ó¦ì¤¸²Õ¡A²Ä¤@­Ó¦ì¤¸²Õ¬O·|¦³¥|­Ó 1¡A¨ä«á¦A±µ¤@­Ó 0¡A©Ò¥H²Ä¤@­Ó¦ì¤¸²Õ¬O 1111 0 000¡]Åܦ¨¤Q¤»¶i¦ì¼Æ¬° 0F0h¡^¡A¥Õ¦âªº¤T­Ó 0¡A´N¬O 2F91Ah Åܦ¨¤G¶i¦ì¼Æªº«e¤T­Ó¥Õ¦âªº 0¡C

±µ¤U¨Ó´N¬O¨Ì§Ç§â 2F91Ah ªº¤G¶i¦ì¼Æ¡A¨C¦¸¨ú¥X¤»­Ó¦ì¤¸¡A«e­±¥[¤W 10¡C²Ä¤G­Ó¦ì¤¸²Õ¬O 10 10 1111¡]¤Q¤»¶i¬°¬O 0AFh¡^¡A²Ä¤T­Ó¦ì¤¸²Õ¬O 10 10 01 00¡]0A4h¡^¡A²Ä¥|­Ó¦ì¤¸²Õ¬O 10 01 1010¡]09Ah¡^¡Cµ²ªG¬O 0F0h¡B0AFh¡B0A4h¡B09Ah¡C


µù¸Ñ

Âà´«¦¨ UTF¡Ð16 ªº¥t¤@ºØ¤èªk

¦pªG¦r¤¸¤£¦b°ò¥»¦h»y¤å¦r­±¤W¡AÂà´«¦¨ UTF¡Ð16 ÁÙ¦³¥t¤@ºØ¤èªk¡G­º¥ý§â¸Ó¦r¤¸ªº UCS¡Ð4 ´î¥h 10000h¡C²Ä¤G¨B¡A±N¥¦Åܬ°¤G¶i¦ì¡AÀ³¸Ó·|¦³ 20 ­Ó¦ì¤¸¡A±q¤¤¤À¦¨¤@¥b¡A¨C¥b¤Q¦ì¤¸¡C²Ä¤T¨B¡A§C¦r²Õ«e­±¥[¤W 110111¡A°ª¦r²Õ«h¥[¤W 110110¡A³Ì«á±N¨â­Ó¦r²ÕÅܬ°¤Q¤»¶i¦ì§Y¥i¡C

¨Ò¦p­n§â¡u炭¡v¦rÂà·|¬° UTF¡Ð16¡A¥¦ªº¸U°ê½X¬O 2F91Ah¡A´î¥h 10000h ¬° 1F91Ah¡AÅܬ°¤G¶i¦ì¬O¡G

1F91Ah¡×0001 1111 1001 0001 1010b

±q¤¤¤À¦¨¤@¥b¡A°ª¦r²Õ¬Oµµ¬õ¦âªº³¡¤À¡A¥[¤W 110110¡AÅܬ°¡u1101 1000 0111 1110¡v¡A´«ºâ¦¨¤Q¤»¶i¦ì¬O 0D87Eh¡C§C¦r²Õ¬O¥Õ¦âªº³¡¤À¡A¥[¤W 110111¡AÅܦ¨¡u1101 1101 0001 1010¡v¡A´«ºâ¦¨¤Q¤»¶i¦ì¬O 0DD1Ah¡C¦X°_¨Ó¡u炭¡v¦rÂà·|¬° UTF¡Ð16 ¬O 0D87Eh 0DD1Ah¡C

«á°O¡G¸U°ê½X¬O¥Î´X­Ó¦ì¤¸¨Ó¶i¦æ½s½X¡H

¤£°O±o¬O­þ¦³¤@¤Ñ¡A¦bºô»Úºô¸ô¤W¬d¸ê®Æ¡A¬Ý¨ì¤F¤@­Ó°ÝÃD¡G¡uUnicode ¬O¥Î´X­Ó¦ì¤¸¨Ó¶i¦æ½s½X¡H¡v¡C«á¨Ó·j´M¤F¤@·|¨à¡Aµo²{¦b³\¦h¦Ò¸Õ³£´¿¥X²{³o¤@ÃD¡A¥]§t¥Á°ê 96 ¾Ç¦~«×¥|§Þ¤G±M²Î¤@¤J¾Ç´úÅç¤u·~³]­pÃþª«²z­pºâ¾÷·§½×¸ÕÃD¡B¥Á°ê 103 ¾Ç¦~«×«Ø°ê¤¤¾Ç¸ê°T¬ì®Õ¶¤¿ï©ÞÁɵ§¸Õ³£¦³³o¤@ÃD¡C¦ý¬Oµª®×³ºµM¥O¤p¤ì°¸¶Ì²´¡A¤£¬ù¦Ó¦P³£¬O¡u16 ¦ì¤¸¡v¡C°²¦p±z¥J²Ó¬Ý§¹¤W­±ªº»¡©ú¡A´N·|ª¾¹D¡Aµª®×¿ù±oÂ÷ÃСC§Ú°ê±Ð¨|¬°¤F¤è«K¡A±`¥H¿ï¾ÜÃD¥XÃD¡A¦ý¬O³o«o©Ï®`¤F¾Ç¥Íªº«ä¦Ò¡C

¥H³o¤@ÃD¬°¨Ò¡A¸U°ê½X¦³³\¦hºØ½s½X¤è¦¡¡A±`¥Îªº¬O UTF¡Ð8 ©M UTF¡Ð16¡C¦pªG¬O UTF¡Ð8 ¤è¦¡½s½X¡A¦³¥i¯à¬O¤@­Ó¦ì¤¸²Õ¡A¤]¦³¥i¯à¬O¨â­Ó¦ì¤¸²Õ¡B¤T­Ó¦ì¤¸²Õ¡A¬Æ¦Ü¬O¥|­Ó¦ì¤¸²Õ¡C¦pªG¬O UTF¡Ð16 ½s½X¡A¥i¯à´N¬O¨â­Ó¦ì¤¸²Õ©Î¥|­Ó¦ì¤¸²Õ¡C¦]¦¹³o¤@ÃD¡AÀ³¸Ó­n°e¤À¤~¬O¡A§_«hÃD¥Ø´N¸Ó«ü¥X¥H¦óºØ½s½X¡C