7월, 2014의 게시물 표시

유니코드 한글 자소 문자 처리

이미지
한글 음절 문자를 자소 단위로 분해하거나 또는 반대로 자소 문자들을 합쳐서 하나의 음절 문자로 만드는 자바 소스 코드이다. 이에 관한 간략한 배경 지식이 필요한 경우, 이 글을 참고하기 바란다.

package kr.pe.elex.hangeul;
/**
* Created by Elex on 2014-07-11.
*/
public class HCharacter {
// 한글 음절
protected static final char HANGEUL_SYLLABLE_BEGIN '\uAC00';
protected static final char HANGEUL_SYLLABLE_END '\uD7AF';

// 한글 자모
protected static final char HANGEUL_JAMO_BEGIN '\u1100';
protected static final char HANGEUL_JAMO_END '\u11FF';

protected static final char HANGEUL_JAMO_CHOSEONG_BEGIN '\u1100';
protected static final char HANGEUL_JAMO_CHOSEONG_END '\u1112';
protected static final char HANGEUL_JAMO_CHOSEONG_OLD_BEGIN '\u1113';
protected static final char HANGEUL_JAMO_CHOSEONG_OLD_END '\u115F';
protected static final char HANGEUL_JAMO_JUNGSEONG_BEGIN