<aside>
🐕 강아지와 데이터를 좋아하는 데이터 사이언티스트 민동률 입니다!
</aside>
<aside>
🇰🇷 Profile
- Name : Min Dongryul
- Job : Data Scientist
- Age : 29
- Email : [email protected]
- Research Interests
- NLP
- Data Centric AI
- Data Preprocessing
- LLM Inference Evaluation
- LLM Hallucination Evaluation
</aside>
<aside>
👩💻
Career
- Antock(Data Scientist) 2025.02 ~
- 기업 기술 분류 모델 개발
- 기업들이 가진 텍스트 데이터(특허 & RnD 데이터등) 및 기술 분류 코드 데이터(KSIC CODE)등을 통해 ML모델을 학습하여 기업들이 현재 지닌 기술과 과거 기술을 분류하고 측정하여 팀 내 다른 프로젝트에서 독립 변수로 사용하고자함
- 뉴스 기사 요약 프로세스 구축
- 특정 뉴스 기사들이 특정 기업의 뉴스가 맞는지 판단하고 이를 요약하는 과정에 있어 Langgraph의 그래프를 설계하고 Langsmith로 추적하는 과정을 진행하였고 실제 사람의 수기검증 결과와 비교하는 과정으로 평가 프로세스를 구축하였음
- PHI Digital Healthcare(Data Scientist) 2023.03 ~ 2024.10
- LLM 학습 데이터 개발 및 평가 프로세스 구축
- 병원 텍스트 데이터를 Python과 MSSQL을 통해 데이터 변환 및 전처리를 진행 하였으며 해당 텍스트를 의료 도메인 모델을 학습시키는 데에 사용하였으며 기존 다른 모델들보다 의료 도메인 지식 부분에서의 성능이 뛰어나도록하는데에 기여하였고 파인튜닝 태스크 데이터 개발 및 평가 프로세스를 구축하였음
- 딥러닝 오픈 소스 프로젝트 개발
- Python의 Streamlit과 FastAPI를 통해 딥러닝의 주요 4가지 Task에 관해 유저들이 쉽게 사용할 수 있도록 구현하였고 배포의 경우 오픈소스 포함 4가지 방식을 통해 진행하였으며 최종적으로 딥러닝을 모르는 일반인들이 딥러닝에 관해 쉽게 접근할 수 있게 하고자하였음
- 심혈관질환 대시보드 개발
- 데이터 전처리를 위한 파이썬, 대시보드 제작을 위한 태블로 이 두 가지 스킬을 통해 일반인들도 심뇌혈관 질환의 위험성등을 깨달을 수 있게 하고자함
</aside>
<aside>
📖 Education
- 한양대학교 인공지능융합대학원 인공지능시스템학과 : 2024.03 ~ 2027.02
- 인덕대학교(전공심화) 정보통신공학과 : 2021.03 ~ 2022.02
- 인덕대학교 정보통신공학과 : 2016.03 ~ 2021.02
</aside>
<aside>
💳 Certificate
- 빅데이터분석기사(2022.12)
- SQLD(2022.11)
- 정보처리기사(2021.06)
- 정보처리산업기사(2020.08)
- 정보처리기능사(2018.11)
</aside>
<aside>
🔤 Language
- JLPT N2(2022.01)
- JPT 640(2021.10 ~ 2023.10)
</aside>
<aside>
🔗 Link
<aside>
🤖 AI model
<aside>
👐
Volunteer & Leadership Experiences
- AI야, 놀자 시즌1(2024.11 ~ 2025.02)
- 데이터야 놀자 2024(2024.02 ~ 2024.06)
- 데이터야 놀자 2023(2023.09)
- 자원 봉사 & 컨퍼런스 타임 테이블 진행
</aside>
📚 Study & Skills
Python
AI
Elasticsearch
Tableau
DB
Linux
Docker
GitHub
Coding Test
🏫 Education
| --- | --- | --- |
🎊 Conference