경제 뉴스 기사 변환 모델

모델 설명

경제에 대한 관심도가 향상되는 시대에 전문용어와 배경지식을 요구하는 경제 기사를 읽기 어려워 하는 사회 초년생을 대상으로 타켓팅하여 만든 자연어처리 기반 서비스를 구현하기 앞서 제작되었다. 기존 제품이나 연구에서는 대부분 빅데이터 분석용으로 만들어진 경우가 많았기 때문에 해당 모델은 전문 용어를 쉬운 어휘로 변환하거나 배경 지식이 필요한 용어를 설명해주는 방법으로 자연어처리를 하였다.

개발 기간

2024.09. ~ 2024.12.

Contributor

최유림 : san-sae

의존성

이 프로젝트는 다음과 같은 주요 의존성에 의존합니다:

Python
python : 3.9.13
pip : 22.3.1
── tokenizers@0.14.1
├── transformers@4.37.2
├── torch@2.1.0
├── tqdm@4.66.1
├── datasets@2.14.5
├── numpy@1.26.0
├── pandas@2.1.3
├── json@2.0.9
├── os-sys@2.1.4
├── torchdata@0.6.1
├── torchtext@0.16.0
├── torchvision@0.16.0
├── regex@2023.10.3
└── re (내장 모듈)

모델 유효성 테스트

경제 기사 변환 모델의 성능과 효과를 검증하기 위해 통계론적 방법론을 활용하였다. 경제 기사 변환 모델과 비슷한 연구나 제품과 비교하여 유효성을 평가하기에 데이터나 비교군이 부재하여 설문조사를 실시하였다. 설문조사의 결과는 파이썬 'seaborn'과 'matplotlib' 라이브러리를 사용하여 분석하였고, 분석한 결과는 아래와 같다.

아래의 산점도는 원문 텍스트와 변환 텍스트 간의 이해도 수준 차이를 나타낸다. 값이 양수인 경우 변환 텍스트가 원문 텍스트보다 더 이해하기 쉬움을 나타낸다.

아래의 상관행렬은 변환 텍스트와 관련 변수들 간의 상관관계를 나타낸다. 'Helpfulness of term explanation' 항목과 'diff' (변환 텍스트 이해도- 원문 이해도) 항목 간의 상관 계수가 0.412310으로 양의 상관관계를 보이므로 용어 설명의 유용성이 높아질수록 변환 텍스트의 이해도가 높아지는 패턴을 관찰할 수 있음을 시사한다.

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
data		data
EconomicNewsSimplification.ipynb		EconomicNewsSimplification.ipynb
README.md		README.md
abbreviations.csv		abbreviations.csv
economic_news.ipynb		economic_news.ipynb
nlp_result.csv		nlp_result.csv
nlp_result.ipynb		nlp_result.ipynb
simplified.csv		simplified.csv
vocab.txt		vocab.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

경제 뉴스 기사 변환 모델

모델 설명

개발 기간

Contributor

의존성

모델 유효성 테스트

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

경제 뉴스 기사 변환 모델

모델 설명

개발 기간

Contributor

의존성

모델 유효성 테스트

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages