Up: [[문자집합,character_set]]? [[코드,code]] = Terms = [[문자,character]] [[글자,letter]]? //문자, writing system, character, letter, alphabet, 자소=WpEn:Grapheme 등의 관계 먼저 명확히 해야 함. 그리고 이것들과 [[기호,symbol]], [[숫자,digit]], .. { [[정보,information]], [[기호,symbol]]과의 관계? 서술 TBW 글리프/glyph와의 관계가? glyph는 글자의 모양과 관련된 듯. [[글리프,glyph]] - w, rr symbol, glyph를 제외한 관련 어근/단어: script, graph, gram(ex. pictogram), sign, mark(ex. diacritical marks), 관련 표현: 문자 체계, writing system, type/typography, font, accent, (모여서: word, text, string, ..., (글^^text^^의 경우: [[문장,sentence]], paragraph(단락 or 문단), ...), Sub: Visible(?) Ggl:"visible character and invisible character" ? [[알파벳,alphabet]] [[로마자,Latin_alphabet]] [[그리스문자,Greek_alphabet]] - ''알파벳 으로 바꿀까....'' 한글 Korean_alphabet / Hangeul [[MathNote:한글과_유니코드]] 한자 Hanja WtEn:Hanja IPA WtEn:IPA ...... [[숫자,digit]] 제어문자 control_character WtEn:control_character 전송제어문자 Ndict:전송제어문자 Ggl:전송제어문자 ...기타 가능한 분류: ... 표음문자 vs 표의문자, Ggl:"표음문자 vs 표의문자" ... 특수문자/특수기호, Ggl:"특수문자/특수기호" ... 선문자(TUI에서 box drawing등을 위해 쓰임), line drawing character / box drawing character 였나? ... Ggl:"line drawing character" ... 수학기호(rel. [[TeX_및_LaTeX_수식_문법]]), ... 구두점, ... 화살표, ... (문자분류들추가) ...기타 문자들(나열↓, TOCLEANUP) ...[[괄호,parenthesis]] ...[[부호,sign]] (plus and minus) ...null character - [[널,null]] [[문자,character]] U+0000 ? ...backslash WtEn:backslash ---- tmp bmks en Why is the DOS path character "\"? (2005) https://web.archive.org/web/20100612035120/http://blogs.msdn.com/b/larryosterman/archive/2005/06/24/432386.aspx https://news.ycombinator.com/item?id=26272492 See also: [[AltCodes윈도특수기호문자입력]] [[코드,code]] [[유니코드,Unicode]] encoding/decoding fixed-width vs variable-width(WpEn:Variable-width_encoding) '''문자character'''를 일차원으로 나열한 [[문자열,string]] (스트링) 이것은 tuple/array/vector/list 중 정확히 무엇인가?? type이 일정하므로 list보다는 앞 세가지인데. tuple은 immutable string, array/vector는 (mutable string/string buffer) 에 비슷?? 비교가능? '''character'''의 [[집합,set]]이 [[문자집합,character_set]]? [[자료,data]] 줄여서 '''char''' '''''[[글자,letter]]?''''' 글자의 (character를 제외한) 다른 뜻: letter QQQ letter와 character의 차이는? } [[기호,symbol]] [[글리프,glyph]] ASCII - [[,ASCII]] 애스키 or 아스키 중에 TBD. EBCDIC - [[엡시딕,EBCDIC]] [[코드,code]] Unicode encoding/decoding { MKL [[문자,character]] [[문자집합,character_set]] [[코드유닛,code_unit]] [[코드포인트,code_point]] 아주 간단히는 Unicode encoding : 'A' → 65 Unicode decoding : 65 → 'A' 더 정확히 하면 [[인코딩,encoding]] : [[코드유닛,code_unit]]의 크기보다 큰 [[코드포인트,code_point]]를 분해해서 적재하는 과정 [[디코딩,decoding]] : 코드유닛으로부터 코드포인트를 복원하는 과정 } [[코드포인트,code_point]] { 0 ~ 0x10FFFF 특이한 코드포인트 모음 https://github.com/Codepoints/awesome-codepoints https://news.ycombinator.com/item?id=25415515 } [[코드유닛,code_unit]] 아주 간단히는 Unicode encoding : 'A' → 65 Unicode decoding : 65 → 'A' ||[[인코딩,encoding]] ||코드유닛의 크기보다 큰 코드포인트를 분해해서 적재하는 과정 || ||[[디코딩,decoding]] ||코드유닛으로부터 코드포인트를 복원하는 과정 || see also [[코드,code#s-2]] 인코딩, 부호화, encoding [[정규화,normalization]] see also [[AltCodes윈도특수기호문자입력]] = Bmks ko = https://pub.mearie.org/유니코드와한글 유니코드 한중일 잔혹사​ https://j.mearie.org/post/155446739768/cjk-strangeness-in-unicode = Links = Unicode in five minutes (2013) https://richardjharris.github.io/unicode-in-five-minutes.html https://news.ycombinator.com/item?id=24157201 The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!) (2003) https://www.joelonsoftware.com/2003/10/08/the-absolute-minimum-every-software-developer-absolutely-positively-must-know-about-unicode-and-character-sets-no-excuses/ by Joel_Spolsky What Every Programmer Absolutely, Positively Needs To Know About Encodings And Character Sets To Work With Text (2011) https://kunststube.net/encoding/ https://news.ycombinator.com/item?id=24162499 Twins: https://pub.mearie.org/유니코드 https://foldoc.org/Unicode p TheUnicode https://everything2.com/title/Unicode http://fileformats.archiveteam.org/wiki/Unicode https://narucode.org/0/유니코드 [[파이썬,Python]] 위키 : https://wiki.python.org/moin/Unicode