음운(음소, 운소), 음절, 형태소, 단어, 어절, 문장

2021. 11. 11. 13:31·Programming/NLP
 

음운 < 음절 < 형태소 < 단어 < 어절 < 구절 < 문장 < 문단

 


 

음운 (phoneme) : 음소 + 운소, 뜻을 구별해주는 소리의 가장 작은 단위
음소 (segmental phoneme) : 분절 음운 (자음(consonant)과 모음(vowel)의 발음)
운소 (prosodeme) : 비분절 음운 (음의 장단, 고저, 세기, 억양)

운소의 예시로 '밤' 을 들 수 있음

길게 [바~암] → 먹는 밤

짧게 [밤] → 어두운 밤

 

음절 (syllable) : 발음할 때 한번에 소리낼 수 있는 소리의 단위 (한 글자)
형태소 (morpheme) : 뜻을 가진 말의 가장 작은 단위 (풋-, 사과)
단어, 낱말 (word)  : 문장에서 혼자 쓸 수 있는 가장 작은 단위
어절 (word segment) : 문장을 구성하고 있는 각각의 마디 (띄어쓰기의 단위)
문장 (sentence) : 완결된 내용을 나타내는 최소의 단위

 


 

예를 들어 다음과 같은 문장이 있다고 해보자

집 앞으로 맑은 물이 흐른다

 

음운은 [지바프로말근무리흐른다] 에서 보이는 자음과 모음 → 25개

음절은 [지/바/프/로/말/근/무/리/흐/른/다] → 11개

형태소는 '집/앞/으로/맑/은/물/이/흐르/ㄴ다' → 9개

단어는 '집/앞으로/맑은/물/이/흐른다' → 7개

어절은 '집/앞으로/맑은/물이/흐른다' → 5개

문장은 '집 앞으로 맑은 물이 흐른다' → 1개

 

 

저작자표시 비영리 변경금지 (새창열림)

'Programming > NLP' 카테고리의 다른 글

Tokenizer 종류  (0) 2023.01.25
[DST] AG-DST  (0) 2022.04.04
[Seq2Seq] Sequence to Sequence Learning with Neural Networks  (0) 2022.03.11
Ontology, 온톨로지  (0) 2022.03.10
[Transformer #1] Positional Encoding (Position Embedding)  (0) 2021.11.16
'Programming/NLP' 카테고리의 다른 글
  • [DST] AG-DST
  • [Seq2Seq] Sequence to Sequence Learning with Neural Networks
  • Ontology, 온톨로지
  • [Transformer #1] Positional Encoding (Position Embedding)
카이로셜
카이로셜
  • 카이로셜
    카이로스의 시간
    카이로셜
  • 글쓰기 관리
  • 전체
    오늘
    어제
    • 분류 전체보기
      • Programming
        • Python
        • Linux
        • Git, Github
        • ML, Machine Learning
        • DL, Deep Learning
        • NLP
        • Computer Vision
        • Network
        • PyCharm
      • IT
        • Windows
        • Mac OS
        • Programs
        • 한글
        • Word
        • Excel
        • PowerPoint
      • Math & Statistics
      • English
      • Graduate School
      • etc.
      • Record
  • 블로그 메뉴

    • Github
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    윈도우11
    아나콘다 가상환경
    윈도우10
    객체
    도커
    아나콘다
    anaconda
    맥북 단축키
    클래스
    docker
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
카이로셜
음운(음소, 운소), 음절, 형태소, 단어, 어절, 문장
상단으로

티스토리툴바