euc-kr,cp949용 정규식으로 한글을 1문자로 처리해서 잘라내기 , 한글 케릭터 인코딩 구조

한글 캐릭터 인코딩 구조

  • EUC-KR (완성형 한글)
    • 범위
      • [00-7F] : KS X1003(로마자 문자집합, ASCII + ISO/IEC646 기반 7비트 문자집합)
        • ASCII 로 봐도 무방하다!
      • [A1-FE][A1-FE]: KS X 1001 (KS C 5601, 특수문자, 한글, 한자 순으로 들어가있다.)
        • [A1-AF][A1-FE] : 특수문자, 기호, 한글 자모등
          • [A4][A1-FE] : 한글 (초,중,종성)글자
          • [AA][A1-F3] :히라가나
          • [AB][A1-F6] :카사카나
        • [B0-C8][A1-FE] : 한글
        • [CA-FD][A1-FE] : CJK 한문
        • 중간에 빠진 범위는 사용자 정의 영역
  • CP949 (확장 완성형 한글)
    • 범위
      • [00-7F] : KS X1003(로마자 문자집합, ASCII + ISO/IEC646 기반 7비트 문자집합)
        • ASCII 로 봐도 무방하다!
      • [A1-FE][A1-FE]: KS X 1001 (KS C 5601, 특수문자, 한글, 한자 순으로 들어가있다.)
        • [A1-AF][A1-FE] : 특수문자, 기호 등
          • [A4][A1-FE] : 한글 (초,중,종성)글자
          • [AA][A1-F3] :히라가나
          • [AB][A1-F6] :카사카나
        • [B0-C8][A1-FE] : 한글
        • [CA-FD][A1-FE] : CJK 한문
        • 중간에 빠진 범위는 사용자 정의 영역 등
      • [81-A0][41-5A,61-7A,81-FE] : 확장 한글
      • [A1-C5][41-5A,61-7A,81-A0] : 확장 한글
      • [C6][41-52] : 확장 한글
    • MAP
  • 정규식으로 한글을 1문자로 처리해서 잘라내기
    • PHP 소스
    • 결과

 

댓글
  • No Nickname
    No Comment
  • 권한이 없습니다.
    {{m_row.m_nick}}
    -