↓Skip to main content

Soeun Uhm

Soeun Uhm

Problem-solving Engineer, talented in grit.

Recent

[Review] - Anatomy of High-Performance Matrix Multiplication

February 25 2025·10 mins· loading · loading

Papers BLAS gemm

BLAS(gemm, gemv) 연산 최적화 방법들

Nsight Systems Tutorial

February 15 2025·2 mins· loading · loading

Tools nsight profiling

nsight systems 으로 하는 프로파일링

[Review] - Efficient Memory Management for Large Language Model Serving with PagedAttention

January 15 2025·24 mins· loading · loading

Papers vLLM PagedAttention

vLLM Paper Review

How Netflix uses Triton for model scoring service

July 27 2024·5 mins· loading · loading

Learings and Painpoints of using Triton

코딩 일지: Daily Coding Times 제작 후기

July 11 2024·3 mins· loading · loading

Project daily coding times

일간 코딩 신문 배달왔습니다 !

CUDA 기반 matmul 성능 최적화하기

June 8 2024·3 mins· loading · loading

CS Multicore-GPU-Programming cuda

CUDA stream 사용하기

CUDA Memories : 레지스터, 공유 메모리, 글로벌 메모리

May 31 2024·11 mins· loading · loading

CS Multicore-GPU-Programming cuda

언제, 어떤 메모리를 사용해야 할까?

CUDA와 Nvidia GPU 아키텍처: 스레드 계층, 메모리 계층 및 GPU 캐시 구조 이해하기

May 29 2024·10 mins· loading · loading

CS Multicore-GPU-Programming cuda

CUDA 의 스레드 계층와 GPU 하드웨어의 관계, 메모리 계층, GPU 캐시 구조

CPU-GPU 통신 및 CUDA를 활용한 이미지 프로세싱 기법

May 28 2024·10 mins· loading · loading

CS Multicore-GPU-Programming cuda

CUDA 프로그래밍 작성에 필수적인 CUDA 스레드 계층구조와 스레드 인덱싱