Data Scientist

통계적 통찰력으로 가치를 창출하는 김윤아입니다

통계학을 기반으로 데이터 전처리, 모델링, 성능 검증까지 논리적으로 연결합니다. 연구실과 산학 프로젝트에서 쌓은 실무형 데이터 경험을 바탕으로 문제를 구조화하고, 검증 가능한 분석 결과로 전환하는 데이터 사이언티스트입니다.

통계학 기반 수치적 원리와 확률적 사고
빅데이터 연구 대학원 연구와 산학 과제 경험
실무형 검증 ETL, 모델링, DB 성능 테스트
Profile

통계적 사고와 최신 IT 기술을 연결합니다

청주대학교 통계학과에서 데이터의 근간이 되는 수치적 원리와 확률론적 사고를 학습했고, 충북대학교 대학원에서 빅데이터 석·박사 과정을 거치며 데이터 전 영역을 아우르는 전문성을 쌓았습니다.

단순히 알고리즘을 적용하는 데 그치지 않고 데이터의 분포와 특성을 해석하며, 이를 바탕으로 데이터 전처리부터 모델링, 성능 검증까지 무리 없이 이어지는 분석 파이프라인을 설계합니다.

연구실과 산업 현장에서 SANique 솔루션 테스트, ArangoDB 벤치마킹, 실시간 비정형 데이터 분류 등 실제 문제를 다루며 신뢰도 높은 결과를 만드는 태도를 길러왔습니다.

문제 정의

복잡한 데이터를 구조화하고 핵심 변수를 찾아 분석 가능한 형태로 정리합니다.

성능 검증

데이터 무결성, 백업/복구 시나리오, DB 벤치마킹처럼 재현 가능한 검증을 설계합니다.

성실한 기록

기술 스택과 연구 과정을 꾸준히 기록하며 학습을 실무 역량으로 전환합니다.

Experience

학업과 연구 경험을 데이터 실무 역량으로 확장했습니다

2022.03 - 2024.02

충북대학교 빅데이터학과 박사 수료

빅데이터 분석, 실시간 데이터 처리, 기계학습 기반 분류와 예측 연구를 수행했습니다.

2020.03 - 2022.02

충북대학교 빅데이터학과 석사 졸업

연구실 프로젝트와 산학 과제를 통해 데이터 전처리, 모델링, 성능 분석 경험을 쌓았습니다.

2015.03 - 2020.02

청주대학교 통계학과 학사 졸업

통계적 추론, 확률, 데이터 분석의 기초를 학습하며 분석 역량의 토대를 다졌습니다.

Research

충북대학교 대학원 빅데이터 연구실 연구원

교수진과 동료의 추천으로 우수학생상을 수상했고, 데이터커맨드 프로젝트와 산업 현장 과제에 참여했습니다.

Skills

데이터 분석부터 모델링, 시스템 검증까지 다룹니다

Python
Deep Learning
NLP
R
SQL & MongoDB
Python Pytorch Tensorflow MongoDB ETL Linux JavaScript Windows Server NLP 통계 분석 로그 전처리 데이터 무결성 검사 비정형 데이터 분류 모델 성능 검증
Projects

연구와 산업 현장의 문제를 데이터로 풀었습니다

수소 에너지 농업현장 실증 및 적용 확대

시설, 생육환경, 생육 데이터의 특성을 분석하고 미처리 데이터에 대한 이상 감지 기법을 설계 및 구현했습니다.

ETL Python MongoDB Linux

Multi-path Data Protection 솔루션 윈도우 환경 테스트

로그 분석을 통해 데이터 무결성을 검증하고 백업/복구 시나리오 테스트를 수행했습니다.

Windows Server 로그 전처리 무결성 검사

YCSB 기반 ArangoDB 성능 벤치마킹 시스템

리눅스 터미널 기반 사용자 입력 제어 프로그램을 구현해 벤치마킹 시나리오별 자동화 동작을 수행했습니다.

Linux JavaScript Benchmark

클라우드 소싱 기반 지역 교통 이벤트 검출 기법

실시간 문자 데이터를 수집하고 교통 유무와 사고 유형을 분류하는 기계학습 기반 시스템을 구현했습니다.

Python Pytorch Tensorflow MongoDB
Awards

수상과 특허로 검증된 연구 성과

2024 제 11회 전국ICT융합 공모전 특별상 스마트 팜을 위한 작물 생장 예측 모델
ICT 융합 아이디어혁신상 산학연 리서치 트라이앵글 파크 프로그램 (LINC 3.0)
저작권 등록 교통 이벤트 검출 시스템 (Traffic Event Detection System)
한국콘텐츠학회 우수논문상 클라우드 소싱 및 기계 학습을 활용한 교통 이벤트 검출 기법
한국콘텐츠학회 우수논문상 스마트 온실 예측 모델을 위한 농업 데이터 오류 해결 방법 분석
금상 — 학술 문헌 이름 중의성 해소 방법 Name Disambiguation Method in Academic Literature
한국콘텐츠학회 우수논문상 농업 데이터의 오류 유형 분석
충북대학교 산학협력단 특허 출원 소셜 클라우드 환경에서 기계학습 기반의 지역 교통 이벤트 검출 방법 및 장치
Publications

학술 논문 및 학회 발표

SCI(E)

KCI

KCI · 한국콘텐츠학회논문지

Name Disambiguation Scheme for Heterogeneous Academic Literature Based on Multiple Classifiers

Journal of the Korea Contents Association, 2023.11

KCI · 스마트미디어저널

Smart Greenhouse Data Preprocessing System for Autonomous Machine Learning

Journal of Smart Media, 2023.02

KCI · 한국콘텐츠학회논문지

Location-Based Traffic Event Detection Scheme Using Crowdsourcing

Journal of the Korea Contents Association, 2022.04

학회

Spatiotemporal Issue Detection Scheme Using Social Media Data

한국콘텐츠학회 춘계종합학술대회, 2025.05

Regional Topic Detection Scheme Using Social Media Data

한국콘텐츠학회 춘계종합학술대회, 2024.05

Design of a Data Replicator for High Availability in Windows Environments

한국컴퓨터종합학술대회 (KCC 2023), 2023.06

Influencer Detection Scheme Using Retweet Edge Weighting and Betweenness Centrality on Twitter

한국콘텐츠학회 춘계종합학술대회, 2023.05

Intelligent Inference Platform for Smart Greenhouse Control

한국콘텐츠학회 춘계종합학술대회, 2023.05

Traffic Event Detection Scheme Using Crowdsourcing and Machine Learning

한국콘텐츠학회 춘계종합학술대회, 2023.05

Crop Growth Prediction Model Using TCN in Smart Greenhouse Environments

국제컨버전스콘텐츠학회 (ICCC 2022), 2022.12

Location-Based Traffic Event Detection Scheme Using Crowdsourcing-Based Machine Learning

국제컨버전스콘텐츠학회 (ICCC 2022), 2022.12

Efficient Traffic Event Detection Using Crowdsourcing

한국컴퓨터종합학술대회 (KCC 2022), 2022.06

Cover Letter

성실함, 정교함, 실행력으로 함께 성장합니다

통계적 정교함

데이터를 숫자의 나열로 보지 않고 분포와 맥락을 함께 해석합니다. 세부 사항을 놓치지 않는 태도로 분석의 신뢰도를 높입니다.

선제적 실행력

필요한 일이 보이면 먼저 움직이고, 연구실 장비 관리와 환경 정리처럼 공동 작업의 기반을 만드는 일에도 책임감을 가지고 참여했습니다.

꾸준한 학습

NLP, 머신러닝, 딥러닝 이론과 실습을 블로그에 기록하며 기술 스택을 확장해왔습니다. 입사 후에도 빠르게 배우고 팀에 보탬이 되는 구성원이 되겠습니다.

데이터로 문제를 풀 준비가 되어 있습니다

분석, 모델링, 성능 검증이 필요한 곳에서 성실하게 배우고 실행하겠습니다.