경제에 대한 관심도가 향상되는 시대에 전문용어와 배경지식을 요구하는 경제 기사를 읽기 어려워 하는 사회 초년생을 대상으로 타켓팅하여 만든 자연어처리 기반 서비스를 구현하기 앞서 제작되었다. 기존 제품이나 연구에서는 대부분 빅데이터 분석용으로 만들어진 경우가 많았기 때문에 해당 모델은 전문 용어를 쉬운 어휘로 변환하거나 배경 지식이 필요한 용어를 설명해주는 방법으로 자연어처리를 하였다.
2024.09. ~ 2024.12.
- 최유림 : san-sae
이 프로젝트는 다음과 같은 주요 의존성에 의존합니다:
- Python
- python : 3.9.13
- pip : 22.3.1
── tokenizers@0.14.1
├── transformers@4.37.2
├── torch@2.1.0
├── tqdm@4.66.1
├── datasets@2.14.5
├── numpy@1.26.0
├── pandas@2.1.3
├── json@2.0.9
├── os-sys@2.1.4
├── torchdata@0.6.1
├── torchtext@0.16.0
├── torchvision@0.16.0
├── regex@2023.10.3
└── re (내장 모듈)
경제 기사 변환 모델의 성능과 효과를 검증하기 위해 통계론적 방법론을 활용하였다. 경제 기사 변환 모델과 비슷한 연구나 제품과 비교하여 유효성을 평가하기에 데이터나 비교군이 부재하여 설문조사를 실시하였다. 설문조사의 결과는 파이썬 'seaborn'과 'matplotlib' 라이브러리를 사용하여 분석하였고, 분석한 결과는 아래와 같다.
- 아래의 산점도는 원문 텍스트와 변환 텍스트 간의 이해도 수준 차이를 나타낸다. 값이 양수인 경우 변환 텍스트가 원문 텍스트보다 더 이해하기 쉬움을 나타낸다.
- 아래의 상관행렬은 변환 텍스트와 관련 변수들 간의 상관관계를 나타낸다. 'Helpfulness of term explanation' 항목과 'diff' (변환 텍스트 이해도- 원문 이해도) 항목 간의 상관 계수가 0.412310으로 양의 상관관계를 보이므로 용어 설명의 유용성이 높아질수록 변환 텍스트의 이해도가 높아지는 패턴을 관찰할 수 있음을 시사한다.

