메인
기술
메인
기술
무료게임
잡담
자유
개인
일정
갤러리
회원가입
계정 찾기
로그인
HOME
기술
euc-kr,cp949용 정규식으로 한글을 1문자로 처리해서 잘라내기 , 한글 케릭터 인코딩 구조
목록
작성자
공대여자
링크
작성 : 2010-04-29 15:03
조회 : 344
지남
1일간
2010-04-29
-
2010-04-29
좌표
첨부된 파일이 없습니다.
#charset
#weblang
#문자셋
#인코딩
한글 캐릭터 인코딩 구조
EUC-KR (완성형 한글)
범위
[00-7F] :
KS X1003
(로마자 문자집합, ASCII + ISO/IEC646 기반 7비트 문자집합)
ASCII 로 봐도 무방하다!
[A1-FE][A1-FE]:
KS X 1001
(KS C 5601, 특수문자, 한글, 한자 순으로 들어가있다.)
[A1-AF][A1-FE] : 특수문자, 기호, 한글 자모등
[A4][A1-FE] : 한글 (초,중,종성)글자
[AA][A1-F3] :히라가나
[AB][A1-F6] :카사카나
[B0-C8][A1-FE] : 한글
[CA-FD][A1-FE] : CJK 한문
중간에 빠진 범위는 사용자 정의 영역
CP949 (확장 완성형 한글)
범위
[00-7F] :
KS X1003
(로마자 문자집합, ASCII + ISO/IEC646 기반 7비트 문자집합)
ASCII 로 봐도 무방하다!
[A1-FE][A1-FE]:
KS X 1001
(KS C 5601, 특수문자, 한글, 한자 순으로 들어가있다.)
[A1-AF][A1-FE] : 특수문자, 기호 등
[A4][A1-FE] : 한글 (초,중,종성)글자
[AA][A1-F3] :히라가나
[AB][A1-F6] :카사카나
[B0-C8][A1-FE] : 한글
[CA-FD][A1-FE] : CJK 한문
중간에 빠진 범위는 사용자 정의 영역 등
[81-A0][41-5A,61-7A,81-FE] : 확장 한글
[A1-C5][41-5A,61-7A,81-A0] : 확장 한글
[C6][41-52] : 확장 한글
MAP
정규식으로 한글을 1문자로 처리해서 잘라내기
PHP 소스
$str = 'a한bc글 韓a文 ㉠1'; echo "===========","\n"; echo $str,"\n"; echo "===========","\n"; $x = array(); echo "CHAR:HEX","\n"; echo "-----------","\n"; preg_match_all('/[x00-x7f,\s]|[^x00-x7f]./',$str,$x); foreach($x[0] as $v){ echo $v,':'; if(strlen($v)==2){ echo dechex(ord($v[0])),"+"; echo dechex(ord($v[1])),"\n"; }else{ echo dechex(ord($v[0])),"\n"; } } echo "===========","\n";
결과
=========== a한bc글 韓a文 ㉠1 =========== CHAR:HEX ----------- a:61 한:c7+d1 b:62 c:63 글:b1+db :9 韓:f9+db a:61 文:d9+fe :20 :d :a ㉠:a8+b1 1:31 ===========
댓글
/
/
답변
수정
삭제
No Nickname
No Comment
새로운 댓글 작성
권한이 없습니다.
{{m_row.m_nick}}
내용이 너무 많습니다!
-
no-star
★☆☆☆☆
★★☆☆☆
★★★☆☆
★★★★☆
★★★★★
확인
게시물 : 4 (1 page)
📅 달력형
📷 갤러리형
RSS
tag
제목
내용
제목+내용
제목+내용+코멘트
작성자
태그
검색
No
제목
작성자
날짜
조회
공지
[기본형] HTML (with 부트스트랩5.3 , jquery 3.7, vue.js)
#기본형
공대여자
24-02-06
02-06
657
공지
유용한 리눅스(LINUX) 명령어
#linux
#command
공대여자
11-03-03
03-03
9677
공지
[공지] 기술 게시판
#etc
#공지
mins01
05-06-24
06-24
9992
4
[mysql] SHOW CHARACTER SET
1
#database
#mysql
#charset
#utf8
공대여자
20-02-12
02-12
282
3
웹페이지에서 글자가 깨져서 나오는 경우
#web
#charset
#encoding
#글자
#깨짐
공대여자
19-04-29
04-29
607
2
euc-kr,cp949용 정규식으로 한글을 1문자로 처리해서 잘라내기 , 한글 케릭터 인코딩 구조
#charset
#weblang
#문자셋
#인코딩
공대여자
10-04-29
04-29
345
1
[DBMS] mysql 서버 이전시의 캐릭터셋 문제...
#charset
#database
#mysql
공대여자
07-06-13
06-13
218