All my posts
Posts about backend development, optimizing model deployment, and ways to solve real-world problems in a technical way.
2025
[Review] - Efficient Memory Management for Large Language Model Serving with PagedAttention
·
loading
·
loading
Papers
vLLM
PagedAttention
vLLM Paper Review
2024
How Netflix uses Triton for model scoring service
·5 mins·
loading
·
loading
CS
Triton
Learings and Painpoints of using Triton
코딩 일지: Daily Coding Times 제작 후기
·3 mins·
loading
·
loading
Project
daily coding times
일간 코딩 신문 배달왔습니다 !
CUDA 기반 matmul 성능 최적화하기
·3 mins·
loading
·
loading
CS
Multicore-GPU-Programming
cuda
CUDA stream 사용하기
CUDA Memories : 레지스터, 공유 메모리, 글로벌 메모리
·11 mins·
loading
·
loading
CS
Multicore-GPU-Programming
cuda
언제, 어떤 메모리를 사용해야 할까?
CUDA와 Nvidia GPU 아키텍처: 스레드 계층, 메모리 계층 및 GPU 캐시 구조 이해하기
·10 mins·
loading
·
loading
CS
Multicore-GPU-Programming
cuda
CUDA 의 스레드 계층와 GPU 하드웨어의 관계, 메모리 계층, GPU 캐시 구조
CPU-GPU 통신 및 CUDA를 활용한 이미지 프로세싱 기법
·10 mins·
loading
·
loading
CS
Multicore-GPU-Programming
cuda
CUDA 프로그래밍 작성에 필수적인 CUDA 스레드 계층구조와 스레드 인덱싱
블로그에서 바로 실행가능한 라이브 코드 에디터 만들기
·4 mins·
loading
·
loading
Project
live code editor
Ace 와 Piston을 사용해서 만든 웹 코드 에디터
Garbage Collector 작동 방식
·15 mins·
loading
·
loading
CS
Java
python
Garbage-Collector
자바와 파이썬의 Garbage Collector로 알아본 GC 작동원리
CUDA 프로그래밍 기초
·5 mins·
loading
·
loading
CS
Multicore-GPU-Programming
cuda
Hello, CUDA!
Prefix Sum : 효율적인 연산을 위한 가이드
·6 mins·
loading
·
loading
CS
Multicore-GPU-Programming
prefix sum 톺아보기
그래프 구조를 더 효율적으로 저장하는 방법들
·4 mins·
loading
·
loading
CS
Multicore-GPU-Programming
Compressed Sparse Row, Compressed Sparse Column 에 대한 소개
멀티쓰레딩을 편리하게 해주는 OpenMP 사용법
·7 mins·
loading
·
loading
CS
Multicore-GPU-Programming
OpenMP 101
멀티쓰레드에서 행렬 연산(matmul) 성능 증가시키는 방법들
·7 mins·
loading
·
loading
CS
Multicore-GPU-Programming
캐시구조에 따른 행렬곱 연산 성능 높이기
MySQL 서버에서 쓰레드풀은 어떤 역할을 할까?
·8 mins·
loading
·
loading
CS
데이터베이스
클라이언트의 커넥션 풀 - MySQL 의 쓰레드 풀의 관계
[네트워크] 소켓은 어떻게 작동할까?
·6 mins·
loading
·
loading
CS
네트워크
C언어로 본 소켓 프로그래밍
스프링 컨테이너의 확장은 어떻게 하는가?
·3 mins·
loading
·
loading
CS
Spring
Spring Core 4편 - Container Extension Points
스프링빈의 스코프는 무엇인가?
·4 mins·
loading
·
loading
CS
Spring
Spring Core 3편 - Bean Scope
멀티쓰레드에서 쓰레드 간 작업을 어떻게 균일하게 분할할까?
·4 mins·
loading
·
loading
CS
Multicore-GPU-Programming
workload balancing, thread pool
스프링에서 의존관계를 설정하는 방법은 무엇인가?
·13 mins·
loading
·
loading
CS
Spring
Spring Core 2편 - Dependencies
스프링 IoC Container 는 무엇이며 어떤 역할을 하는가?
·10 mins·
loading
·
loading
CS
Spring
Spring Core 1편 - IoC Container, Bean
c++로 알아본 쓰레드 프로그래밍
·9 mins·
loading
·
loading
CS
Multicore-GPU-Programming
쓰레드 관리하기, thread-safety 구현하는 방법
Basic Parallel Architectures에 대해 알아보자
·6 mins·
loading
·
loading
CS
Multicore-GPU-Programming
Superscalar, Multi-core, Vector Processor
[네트워크] HTTP 1.0 vs 1.1 vs 2.0 vs 3.0
·5 mins·
loading
·
loading
CS
네트워크
HTTP의 발전 과정
OpenAI streaming using websockets
·11 mins·
loading
·
loading
CS
OpenAI
프로젝트에 OpenAI steam 기능 사용기
FastAPI Best Practice 로 리팩토링 하기
·9 mins·
loading
·
loading
CS
FastAPI
FastAPI Best Practice
Github Actions 캐시 기능 사용하여 자동 배포 시간 단축하기
·5 mins·
loading
·
loading
CS
Github Actions
CI/CD
Github Actions ‘잘’ 활용하는 방법
Locust 부하테스트를 통해 알아본 적절한 pool size 설정하기
·3 mins·
loading
·
loading
CS
locust
커넥션 풀 사이즈는 무엇이며 어떻게 설정할까?
Nvidia Triton Server 에서 리소스 최대한 활용하기 (Throughput, Latency 개선방법)
·6 mins·
loading
·
loading
CS
Triton
삽질을 통해 헤쳐나간 Triton Server 사용기 - 2탄
컴퓨터의 기본 단위
·3 mins·
loading
·
loading
CS
단위
비트,바이트,컴퓨터 용량, 진법, 메모리 주소
Nvidia Triton Server 에서 모델 배포하기
·3 mins·
loading
·
loading
CS
Triton
삽질을 통해 헤쳐나간 Triton Server 사용기 - 1탄
Python 코드로 알아본 동시성 vs. 병렬성
·8 mins·
loading
·
loading
CS
python
concurrency
실제 파이썬 코드로 비교한 동시성 vs 병렬성, 멀티쓰레딩 vs. 멀티프로세싱
FastAPI 공식문서로 알아본 Concurrency & Async
·8 mins·
loading
·
loading
CS
python
FastAPI
concurrency
FastAPI 는 어떻게 동시성을 보장할까?
비트마스크(BitMask) 알아보기
·5 mins·
loading
·
loading
CS
알고리즘
비트마스킹 논리 연산과 실제 알고리즘 문제 풀이
Chat Your Interview 프로젝트 회고
·10 mins·
loading
·
loading
Project
chat your interview
회고
프로젝트 기술 스택, DB 설계, API 설계, Dockerize, Github actions 활용
Docker 에서 데이터를 관리하는 방법
·13 mins·
loading
·
loading
CS
Docker
Docker Volume , Bind Mount, 환경 변수 설정
Docker Image & Container
·5 mins·
loading
·
loading
CS
Docker
Docker Image , Container 기초와 명령어 정리
2023
2023 회고록
·9 mins·
loading
·
loading
Journal
회고
대학생활 끝무렵, 가장 재밌었던 한 해
python 에서의 비동기 알아보기
·10 mins·
loading
·
loading
CS
python
python 공식 문서를 참고한 async, await, coroutine, task 개념 정리
정규표현식 한번에 정리하기
·3 mins·
loading
·
loading
CS
정규표현식
Regex 101
[네트워크] Wireless and Mobile Networks
·16 mins·
loading
·
loading
CS
네트워크
무선 네트워크에 대한 모든 것
[네트워크] www.google.com 을 입력하면 일어나는 모든 일
·5 mins·
loading
·
loading
CS
네트워크
네트워크 연결부터, 웹 페이지가 보여지기까지
[데이터베이스] Transaction, Concurrency Control, Recovery, Locking
·10 mins·
loading
·
loading
CS
데이터베이스
트랜잭션의 의미와 동시성 제어를 하는 이유, 2PL 까지
[네트워크] Link Layer and LANs
·21 mins·
loading
·
loading
CS
네트워크
Link Layer 에 대한 모든 것
우테코 크리스마스 프로모션
·8 mins·
loading
·
loading
마지막 4주차 후기 🎄
[Java] 람다식과 함수형 인터페이스
·4 mins·
loading
·
loading
CS
Java
Supplier, Consumer, Funtion, Predicate
[네트워크] Network layer - Control plane
·17 mins·
loading
·
loading
CS
네트워크
네트워크 레이어 - control plane 에 대한 모든 것
우테코 2주차 후기
·6 mins·
loading
·
loading
꾸덕꾸덕 나아간 2주차 ✨🚗
Hugo blog 기초부터 만들기
·5 mins·
loading
·
loading
Tips
hugo blog
나의 커스텀 블로그 구축기
[데이터베이스] 정규화의 의미 - 1NF, 2NF, 3NF, 4NF, 5NF
·10 mins·
loading
·
loading
CS
데이터베이스
정규화는 무엇이고, 왜 해야 할까?
[네트워크] Network layer - Data plane
·16 mins·
loading
·
loading
CS
네트워크
네트워크 레이어에 대한 모든 것
우테코 1주차 후기
·5 mins·
loading
·
loading
겸손해진 1주차
이상한 나라 앨리스 코드로 본 객체의 의미
·6 mins·
loading
·
loading
CS
객체지향
객체지향의 본질과 타입
객체의 역할, 책임, 협력
·3 mins·
loading
·
loading
CS
객체지향
객체는 어떻게 협력하는가?
[Java] 클래스 메서드 vs. 인스턴스 메서드
·2 mins·
loading
·
loading
CS
Java
static method vs. instance method 는 언제 써야 할까?
[Java] 생성자(Constructor)
·2 mins·
loading
·
loading
CS
Java
인스턴스 초기화 메서드인 생성자
[Java] 클래스 변수 vs. 인스턴스 변수 vs. 로컬 변수
·3 mins·
loading
·
loading
CS
Java
Java 3가지 변수의 종류
[Java] Enum
·3 mins·
loading
·
loading
CS
Java
관련된 상수의 집합인 Enum
MVC 패턴과 MVC 패턴을 지키기 위한 규칙들
·4 mins·
loading
·
loading
CS
MVC
유지보수가 편해지는 MVC 패턴
유한게임 vs. 무한게임
·2 mins·
loading
·
loading
Journal
나는 인생을 무한게임 처럼 살고 있나?
[네트워크] TCP Congestion Control
·6 mins·
loading
·
loading
CS
네트워크
TCP가 congestion control 을 하는 방법들
[네트워크] Principles of Congestion Control
·3 mins·
loading
·
loading
CS
네트워크
Congestion control 의 원인과 congestion의 cost들
[Java] HashSet vs. Arrays contains() 의 시간복잡도 비교
·2 mins·
loading
·
loading
CS
Java
자료구조
많이 쓰는 contains() 메서드
[네트워크] connection-oriented transport : TCP
·8 mins·
loading
·
loading
CS
네트워크
TCP 에 대한 모든 것
[네트워크] Principles of reliable data transfer
·7 mins·
loading
·
loading
CS
네트워크
rdt 의 발전 과정과 GBN, SR
[네트워크] Transport Layer의 개념과 UDP
·6 mins·
loading
·
loading
CS
네트워크
Transport Layer - 1
[네트워크] Video Streaming and Content distribution Network
·3 mins·
loading
·
loading
CS
네트워크
비디오 스트리밍에 쓰이는 DASH 분산 네트워크인 CDN
[네트워크] P2P applications
·3 mins·
loading
·
loading
CS
네트워크
P2P application(BitTorrent) vs. Server-client architecture
[네트워크] Domain Name System(DNS)
·5 mins·
loading
·
loading
CS
네트워크
인터넷의 Directory System 인 DNS
[네트워크] Simple Mail Transfer Protocol(SMTP)
·2 mins·
loading
·
loading
CS
네트워크
메일을 보내기 위한 프로토콜
Elon Musk 자서전을 읽고
·2 mins·
loading
·
loading
Journal
독서
Elon Musk - 윌터 아이작슨
[Java] Maven으로 build 하기
·3 mins·
loading
·
loading
CS
Java
Maven 에 대해 알아보자
[데이터베이스] 데이터를 빠르게 찾게 해주는 Index
·4 mins·
loading
·
loading
CS
데이터베이스
Index개념, 자료구조와 PK와의 비교
[네트워크] Application Layer
·7 mins·
loading
·
loading
CS
네트워크
네트워크 어플리케이션, Web 과 HTTP
Linux File System
·5 mins·
loading
·
loading
CS
Linux
운영체제
리눅스에서는 파일을 어떻게 관리하는가?
[데이터베이스] RDB에서 Key
·6 mins·
loading
·
loading
CS
데이터베이스
Key의 종류와 개념
[네트워크] Computer Netwoks and the Internet
·10 mins·
loading
·
loading
CS
네트워크
네트워크 기초
[네트워크] 비트/바이트와 네트워크 전송률
·1 min·
loading
·
loading
CS
네트워크
bit,byte,KB,MB,GB,TB,bps
GDSC mount - BackEnd 탐구 (2)
·12 mins·
loading
·
loading
CS
GDSC
GDSC Yonsei - BackEnd Mount
GDSC mount - BackEnd 탐구 (1)
·15 mins·
loading
·
loading
CS
GDSC
GDSC Yonsei - BackEnd Mount
[Java] Java의 자료구조
·7 mins·
loading
·
loading
CS
Java
자료구조
Java Collection : Array, List, Set, Map
[Java] Java의 특징
·2 mins·
loading
·
loading
CS
Java
Compile 언어와 JDK , JVM, JRE
20시간의 법칙
·4 mins·
loading
·
loading
Journal
무언가를 배우는데 필요한 시간 - 20시간
FastAPI로 ML Model Endpoint 설계하기
·2 mins·
loading
·
loading
CS
FastAPI
FastAPI 실제로 활용하기
FastAPI 활용
·4 mins·
loading
·
loading
CS
FastAPI
Pydantic, HTTPException 사용하기
FastAPI 기초
·4 mins·
loading
·
loading
CS
FastAPI
HTTP Request Method 설계하기
Cloud Service
·2 mins·
loading
·
loading
CS
AWS
GCP
Cloud Service 개념 알아보기
API 심층탐구
·5 mins·
loading
·
loading
CS
API
API에 대한 (거의) 모든 것
Building Reproducible ML Pipelines
·2 mins·
loading
·
loading
DS
MLOps
ML Model 배포하기 - 4
Research vs. Production Environments
·1 min·
loading
·
loading
DS
MLOps
ML Model 배포하기 - 3
Deployment of ML Pipelines
·1 min·
loading
·
loading
DS
MLOps
ML Model 배포하기 - 2
ML Model Deployment
·1 min·
loading
·
loading
DS
MLOps
ML Model 배포하기 - 1
AuToeic 을 소개합니다 !
·6 mins·
loading
·
loading
Project
AuToeic
회고
토익 part.1 문제 자동 출제 모델
Trees
·3 mins·
loading
·
loading
CS
자료구조
Trees & Binary Trees
팀장은 어떠한 역할을 해야 하는가?
·2 mins·
loading
·
loading
Journal
Team
The role of a team leader
Stack & Queue
·4 mins·
loading
·
loading
CS
자료구조
Stack 과 Queue 개념
Linked List 개념 & 시간복잡도
·2 mins·
loading
·
loading
CS
자료구조
Linked List - 1
Class & Pointer
·4 mins·
loading
·
loading
CS
자료구조
파이썬에서 Class 와 Pointer
Object-Oriented Programming
·1 min·
loading
·
loading
CS
객체지향
OOP 의 특징
[python] 자료형
·4 mins·
loading
·
loading
CS
자료구조
파이썬의 자료형