Skip to main content

2023 회고록

·9 mins· loading · loading ·
Journal 회고
Soeun Uhm
Author
Soeun Uhm
problem-solving engineer, talented in grit.
Table of Contents

2023년 시작한지 얼마 안된 것 같은데 벌써 연말이다. 매해 바빴던 것 같지만, 올해 특히 더 많은 것을 한 것 같다. 나의 만 24년 인생 중 가장 재밌었던 한 해로 꼽을 것 같다.

1~2월
#

데싸랩
#

Data Science Lab 학회에서 부회장을 맡아서 열심히 커리큘럼 짜는 것에 참여하고, 방학동안 세션, 스터디, 특강을 진행했다. 이때 Transformer 세션 발표를 맡았는데, 아직까지 이 영상이 DSL 유튜브 내 최다 조회수이다. 😎 이거 준비할 때 자료도 공들여서 열심히 만들고 구글 BERT의 정석 책을 참고하며 어떻게 하면 더 쉽게 설명할까 고민도 많이 했었다.

객체 지향 프로그래밍 스터디도 했었는데, python 을 조금 더 객체지향 적으로 작성할 수 있도록 공부했다. 실제 모델 코드를 뜯어보았을 때 모두 class 로 나누어져 있고, __init__ 으로 객체 초기화 하고 생성하도록 되어 있었는데 그것을 더 깊이 이해할 수 있는 스터디였다.

MLOps 스터디도 진행했다. 아무래도 모델 자체는 전체 ML Cycle 의 일부분이어서, 전체 사이클이 궁금했다. 모델을 어떻게 서빙하고, 배포하고, 관리하는지 큰 그림을 그릴 수 있었다. 모델 구조를 뜯어보는 것보다 모델을 서빙하고 배포하는 것에 더 흥미로웠다.

KakaoTalk_Photo_2023-12-31-23-18-34
1월 DSL OT

3~4월
#

Team Potatoes
#

DSL 에서 모델링 프로젝트 리드를 맡았다. 지금까지 진행했던 프로젝트 중에서 가장 재미있었다. 팀원들과 조합도 너무 좋았고, 회의할 때마다 아이디어가 넘치고 다들 화이팅이 넘쳤다. 정말 몰입해서 프로젝트를 진행했다. 결과도 좋아서, 특허도 신청했다. 😎

자세한 내용은 이 글에서 볼 수 있다.

AuToeic 을 소개합니다 !
·6 mins· loading · loading
Project AuToeic 회고
토익 part.1 문제 자동 출제 모델

5~6월
#

기업연계 프로젝트
#

네이버 파이낸셜과 기업연계 프로젝트를 진행했다. AutoDQ 라는 프로젝트였는데, 정제되지 않는 영수증 데이터 내역을 받아서 필요한 정보만 남기는 프로젝트였다. 후기를 써야 하는데.. 데이터 관련 비밀 서약을 해서 프로젝트 내용을 공개하기가 조심스럽다.

내가 부회장이었어서, 회사와 연락하는 총괄을 맡았다. 그리고 학회원 15명이 이 프로젝트에 참여했는데, 전체 팀장도 맡았다. 15명이 하나의 팀으로 하기에는 너무 많아서 우선 15명이 공통으로 해야하는 전처리 태스크를 팀원에게 분배하고, 그 후에 팀을 3개로 쪼개고, 각자 파이프라인을 구축하기로 했다. 결과적으로 하나의 문제에 대해 3가지 서로 다른 접근법이 나왔다.

네이버 1784 사옥에 가서 직접 발표도 하고, 피드백도 받았다. 피드백을 굉장히 날카롭게 해주셨다… 역시 현업에서 보는 시각은 다르구나 라는 것을 느꼈다. 그렇지만 접근 방식과 완성도가 꽤 높다는 좋은 피드백을 받아서, 뿌듯하게 프로젝트를 마무리 할 수 있었다.

데싸랩 수료
#

1년간 몸담았던 데싸랩을 수료했다. 작년 여름에 학회에 들어갈 때만 해도 정말 아는 것이 없었는데, 꾸준하게 공부해서 부회장도 맡고 여러 개의 세미나도 열었다. 데싸랩을 통해 내가 재미있는 분야가 무엇인지 명확하게 한 것이 가장 큰 수확인 것 같다. 데싸랩 다수가 DS 쪽으로 가지만, 나는 Data Engineering, MLOps 와 개발하는 것이 더 재미있다. 내가 만든 모델을 실제 사용자가 쓰게끔 하는 과정을 더 공부해 보고 싶었다. 그렇지만, 1년간 선형대수부터 GAN 까지 세션을 통해 배운 것은 나의 큰 자산이 될 것 같다. OpenAI API 가 정말 잘 되어 있어서 API 하나 만으로 거대 LLM 모델을 사용할 수 있지만, 모델의 근간이 되는 Transformer 구조를 뜯어보며 공부한 것은 모델을 이해하는데 많은 도움이 되었다.

나에 대한 성찰도 많이 할 수 있었다. 내 의견이 틀릴 때도 많다는 것을 몸소 느꼈다. 조직을 관리하는 방법과, 사람들을 챙기는 방법에 대해 배웠다. 일을 할 때 의견 충돌이 일어나면 어떻게 해결해야 하는지도 배웠다. 인간관계에 대해 정말 많은 것을 배웠다.

나는 내가 사람들과 부대끼는 것을 별로 안 좋아한다고 생각했었는데, 생각이 바뀌었다. 사람들과 토론하고, 대화하는 것이 굉장히 재밌었다. 오히려 성격이 더 외향적으로 변한 것 같다. 부회장을 한 것도 어찌보면 큰 도전이었다. 통계학과가 다수인 학회에서, 아는 사람 한명도 없이 시작했었다. 6걔월간 다음 기수의 커리큘럼도 제작하고, 다음 기수도 직접 면접 보고 뽑고, 2번의 팀장도 맡고, 지식 측면 말고도 인간적으로도 많이 성장할 수 있었다.

KakaoTalk_Photo_2024-01-01-01-37-23
8&9기

KakaoTalk_Photo_2023-12-31-23-37-43
6걔월을 동고동락한 운영진과

7~8월
#

공모전
#

방학 때는 공모전 2군데를 나갔다. CJ 대한통운 공모전 과 DSL 내부에서 진행한 네오밸류 공모전 이었다. 그 중 CJ 대한통운 공모전 을 통해서 정말 하고 싶은게 확실해졌을 정도로 인상 깊은 공모전이었다. 주소를 가지고 주소에 있는 오타 검수, 없는 주소는 삭제, 한 영 혼합 주소 -> 한글 주소로 통일 등의 태스크였다. 평가 기준은 정답률 + 실행 시간이었고, 제출 형태는 url 을 제출하여 postman 으로 request를 보내는 방식이었다.

방학 내내 팀원 3명과 ‘정답률을 높이는 작업’ 을 진행했다. 최신 모델 여러 가지를 비교하면서 써보고 , 결국에는 t5-model 을 사용했다. (회고록이니 상세하게 적지는 않겠다..) 결국에는 100개 테스트 케이스에서 98개를 맞추는 어마어마한 정답률을 낼 수 있었다. 모델을 github 에 올리고 AWS 인스턴스를 만들어서 github 에서 pull 하는 형태로 url 을 만들었다. 지금 생각해보면 별거 아닌데 이거 만들 때도 처음 해보는 작업이라 정말 고생했다 ㅋㅋ 쉽게 할 줄 알고 제출 당일에 시작해서, 자정 제출이었는데 결국 10분 남기고 성공했다.

본선에 가서, 정답률 + 실행 시간 기준으로 평가했다. 총 8개 팀이 본선에 왔는데 4개 팀은 url 에 문제가 생겨서 기권하고, 4팀이 경쟁했다. 진짜 할만하다 라고 생각했다. 정답률은 우리가 제일 높을테니. 하지만 실행속도가 발목을 잡았다. 예상대로 정답률은 우리가 제일 높았지만 실행속도가 제일 느렸다. 그래서 4팀 중 3팀이 본선을 갔는데 우리는 1점 차이로 떨어졌다.

이때 적잖은 충격을 받았다. 내가 지금까지 공부하고, 학회에서 공부하는 것은 ‘성능을 높이는’ 작업이었는데, 어쩌면 이것보다 정답률은 조금 낮추되, ‘실행 속도’ 등 실용적인 것이 더 중요한 것이 아닐까? 하는 생각이 들었다. 그래서 대회 끝나고 1등 팀의 팀명을 검색해보았더니 github 가 나와서 정말 어떻게 했는지 궁금해서 메일을 드렸다. (심지어 학교 선배님이셨다.)

스크린샷 2023-12-22 오전 3 41 15

정말 감사하게도 답장이 왔다 !

스크린샷 2023-12-22 오전 3 42 35

우리도 FastAPI 로 서빙하고 모델도 사용하였는데, 차이가 났던 것은 Triton Inference Server 등을 이용하지 않고 바로 모델 서빙을 한 것이었다. 사실 이때 나도, 팀원들도, 학회원들 모두 TRTIS 를 처음 들어봤다. 그래서 조금 더 적잖은 충격이었다. 속도 개선 등 엔지니어링 적 측면에서 바라봐야겠다는 생각이 처음 들었던 것 같다.

이쪽을 더 공부하고 싶어졌다. 그리고 인턴 일을 계속 하면서도, 모델 여러 개 성능을 비교하는 것보다, 완성된 모델을 실제로 서빙하고 상용화하는 일이 더 재밌었다.

빅지기 세미나
#

내가 그동안 공부한 모델을 상용화하는데 필요한 기술들을 학회원들과 나누고 싶어서 세미나를 기획하고, 5주간 진행했다. 꾸준하게 학회원들이 참여해줘서 나도 매번 열심히 준비해갔다.

colab 말고 실제 ide 를 이용해서 코딩하는 방법, API , 터미널 명령어, Docker, AWS 에 대해 다루었다. 이번 겨울에도 v2 세미나를 기획하고 있다.

ddoddii/skills-for-DS

📚 빅데이터를 지탱하는 기술들 세미나

Python
0
4

9~10월
#

GDSC
#

사용자가 실제 프로덕트를 쓰게 하려면 어떻게 해야하지? 생각하다가 웹 서비스를 만드는 프레임워크를 우선 공부해야 겠다는 생각이 들었다. 그래서 Google Developer Student Clubs 에 Backend member 로 들어갔다. 백엔드가 모든 CS 지식을 필요로 하고, 기본이 되는 분야라고 생각했다.

KakaoTalk_Photo_2023-12-31-23-52-39
GDSC Yonsei

KakaoTalk_Photo_2024-01-01-01-40-03
GDSC 와 한강

컴퓨터과학 복수전공
#

컴과 강의를 1,2 학년때 9학점 정도 들어 놓아서 12학점만 더 듣고 부전공으로 졸업 하려다가 복전을 신청했다.. 이번 학기에는 데이터베이스, 컴퓨터 네트워크, 소프트웨어 공학을 들었다. 모델 튜닝을 할 때도 결국에는 운영체제 지식이 필요하고, 데이터베이스를 잘 이해해야 쿼리 성능 튜닝도 할 수 있다는 것을 체감했다. 그래서 CS 지식을 더 단단하게 공부해야겠다고 많이 느꼈다. 겨울에 이전에 수강했던 CS 과목 복습도 하고, 운영체제, 데이터베이스를 더 깊이 공부할 계획이다.

우테코 프리코스
#

우아한 테크코스 프리코스 - 백엔드에 참여했다. 1달 간 미션 4개가 주어지고, 한 주 마다 미션 한개씩 완성해야 했다. Java 로 진행되었는데, Java 를 깊게 써본 것은 이번이 처음이어서 자바의 정석 1,2 권을 사서 주말마다 정독했다. 프로그래밍 언어를 공부할 수 록 어떻게 이렇게 설계했을까… 신기하다.

결론적으로 본 과정에는 못 갔지만 그래도 한 달간 Java , 클린 코드, 리팩토링, TDD, 설계 에 대해 많이 배웠다. 역시 손으로 짜봐야 실력이 많이 느는 것 같다.

11~12월
#

GDSC - Resume AI Chat Project
#

GDSC ML 파트와 함께 협업해서 CV 를 업로드하면 개인 질문을 생성해주는 프로젝트를 진행했다. 나는 백엔드를 맡았고, 프런트 멤버도 함께 해서 UI 도 완성시켰다. 처음으로 백, 프런트, ML 모두 협업해서 실제로 사람들이 사용할 수 있는 프로덕트를 만들었다. 실제로 데모에서 GDSC 사람들이 모두 사용해보기도 했다. 실제 사람이 내가 만든 서비스를 쓰는 경험은 처음이었는데 아주 짜릿했다 ! 🤩

기말 시험 끝나고, 겨울에 조금 더 프로젝트를 발전시켜볼 계획이다.

KakaoTalk_Photo_2024-01-01-02-03-19
Resume AI Chat Project

종강
#

수강했던 과목들에서 모두 A+ 를 받았다. 특히 컴퓨터 네트워크랑 데이터베이스는 블로그에 개념 정리 포스팅을 했었는데, 중간 / 기말 시험 때 많은 도움을 받았다.

블로그
#

올해 초에 시작해서, 블로그 포스팅 수 가 어느덧 70개를 넘겼다. 꾸준히 할 수 있을까 의심하기도 했지만, 그래도 매 달 꾸준히 포스팅했고, github 커밋 수는 270개를 넘었다. 처음에는 구글에 검색조차 안되는 블로그였지만, 열심히 google search console 에 url 을 등록한 결과 이제는 제법 검색하면 내 블로그 글이 상위에 뜬다.

스크린샷 2024-01-01 오전 1 04 13
5번째로 뜨는 내 블로그

아무도 안쓰던 Hugo 로 블로그를 처음부터 구축하고, 여러 테마를 비교해 가면서 블로그를 키워갔다. 그래서 더 애착이 가는 블로그이다. 무언가를 꾸준히 관리하는 재미를 얻은 것 같다. 나는 글 쓰는 것이 재밌다. 어떠한 개념을 남들에게 설명하는 것에 보람과 재미를 느낀다. 블로그를 쓰면, ‘아 여기까지만 설명하면 되겠지? 이거는 다른 블로그 복붙할까?’ 라는 유혹을 많이 느낀다. 하지만 이 블로그에는 다른 블로그를 복붙하는 글은 쓰지 않기로 다짐했다. 그리고 정말 읽는 사람이 읽기 쉽게 불렛 포인트로 정보를 나열한 글을 쓰지 않고, 줄글로 풀어 썼다. 내가 원서를 읽고 한국어로 번역한 것, 프로젝트 후기, 공식 문서를 보고 작성한 글로만 채워넣었다.

독서 & 기록
#

KakaoTalk_Photo_2024-01-01-01-53-35
2023 읽은 개발 서적

정말 많은 개발 서적을 사고 , 읽었다. 몇몇 권은 아직 다 읽는 못했지만, 대다수의 책을 완독했다.

  • 자바의 정석 1,2 권
  • 데이터베이스 개론
  • 모두의 네트워크
  • 프로그래머의 뇌
  • 이펙티브 자바

2024에는 Real MySQL, 오브젝트, Clean Architecture, 대규모 시스템 설계를 마저 완독해볼 예정이다.

자서전도 읽었다. 밀리의 서재로 Elon Musk 를 읽었는데, 이 책이 나에게 많은 충격을 주었다. 그도 처음에는 초보였고, 아무것도 없었다. 머스크의 도전 정신과, 집착 수준으로 꼼꼼한 성격을 본 받고 싶다. 나도 머스크처럼 세상을 바꿀 수 있는 엔지니어가 되고 싶다.

기록은 2023의 하이라이트라고 할 수 있겠다. 총 3권의 노트를 작성했다. 매일 매일 공책을 들고다니면서 한 생각, 알고리즘 풀이, 프로젝트 회의록 등 모든 순간을 기록했다. 기록이 습관이 되자 기록을 바탕으로 아이디어를 뽑을 수 있었고, 생각들을 연결할 수 있었다. 이 블로그의 첫번째 글인 Zettelkasten Method 에서 기록의 중요성을 말했는데, 몸소 실천한 한 해였다. 2024에도 기록을 위한 노트 3권을 미리 구매했다. 매일 빠짐없이 생각들을 기록해 나갈 계획이다.

KakaoTalk_Photo_2024-01-01-02-00-35
나의 잡다한 기록

커리어 고민
#

커리어 고민은 끝이 없다. Data Science -> MLOps -> 백엔드 ..? 언젠가는 이 점들이 이어지는 순간들이 올 것이라 믿는다. (블로그 이름도 그래서 Soeun’s Dots이다.)

최종적으로 2024 목표는, 백엔드 엔지니어로 취업하는 것이다. 그 후 경력을 쌓은 다음 ML 엔지니어 포지션으로 가고 싶다. 점차 AI 모델이 쏟아져 나오는 세상이 될 것이라고 생각한다. 그렇다면 모델이 필요로 하는 데이터를 정제하고, 모델을 모니터링하고, 관리하는 작업은 더욱 필수적일 것이다.

이렇게 회고를 작성해보니, 2023 많은 것들을 했다. 하지만 찍먹을 많이 했다. 객관적으로 할 수 있게 된 것이 많지만, 한 가지를 정말 잘 하게 된 것은 아닌 것 같다. 2023는 0에서 1 로 만든 해였으면, 2024는 1에서 100으로 만들어야겠다. 많은 프로젝트를 진행했는데, 새로운 프로젝트를 벌리지 말고 지금 해놓은 것을 더 고도화 해야겠다. 💪

최종 회고
#

2023년은 사람들도 많이 만나고, 공부도 많이 한 해였다. 학교와는 연이 없다고 생각했는데, 학회와 GDSC 를 통해 정말 많은 사람들을 만날 수 있었다. 다들 잘 되서 사회에 나가서도 도움을 주고 받는 인연이 되었으면 좋겠다.

블로그 꾸준히 쓰기, 운동하기, 책읽기 등 나와 한 약속들을 많이 지켰다. 내가 지킨 약속들이 언젠가 나를 지켜줄 것이라고 믿는다. 매사에 내가 주인이 되고, 적극적으로 임하면서 즐거움을 찾으려 했다. 작은 성공들이 모여 되돌아보니 나름대로 가치 있는 한 해를 보냈다는 생각이 든다. 다채롭게 색칠한 한 해였다.

이렇게 2023 안녕 👋

Related

AuToeic 을 소개합니다 !
·6 mins· loading · loading
Project AuToeic 회고
토익 part.1 문제 자동 출제 모델