Celery를 활용한 로깅 시스템 , 회고

이미지
최근 .csv, .tsv 등의 형태로 전송되는 로깅 파일을 저장하기 위한 시스템을 구축했다. 프로젝트를 진행하면서 사용한 기술에 대한 회고를 정리했다. (프레임워크에 종속되는 특성보다는 처리 로직에 초점을 맞추었다.) Before deploying Celery 테스트 서버에서 로깅 파일 처리 부하로 인해 서비스들이 멈추기 전까지는 메시지 큐를 활용하여 처리할 필요성을 느끼지 못했다. 그야 동시 요청 수도 없다시피하고 이상적인 환경이니까 그렇다. 이런 환경에서는 웹 애플리케이션 서버가 요청 검증, 파일 파싱, 데이터 전처리, DB I/O 모두 처리할 수 있다. 이 경우에는 파일로 만들어 저장하지 않고 Request 객체로 받은 binary를 파싱했다. 그러나 동시 요청수가 굉장히 많고 언제 Peak request를 찍을 지 알 수 없는 환경에서 안정적인 아키텍쳐는 아니다. 부하 발생 - 모니터링 툴 Locust를 사용하여 측정했을 때, 500명 동시 접속 환경까지 증가시키며 1초에 1번 계속해서 리퀘스트를 보냈을 때 WAS Worker가 2개인 환경에서 금방 리소스가 바닥나서 실패 응답을 받기 시작했다. 지연 응답이 아닌 실패 응답이 나타나기 시작하면 아키텍쳐든 코드든 효율성을 고려하여 수정해야한다. After deploying Celery 실시간에 가깝게 로그 파일을 처리하지 않고, 조금의 지연이 생기더라도 로그 파일을 제대로 처리한다는 보장이 있으면 파일 저장/파일 처리 로직을 담당하는 프로세스로 나누어서 각 프로세스의 작업의 무게를 줄일 수 있다. 이렇게 구성한다면 요청 인증/파일 저장/파일 처리 로직을 전부 맡아서 하던 WAS는 요청 인증/파일 저장까지만 하고 그 뒤의 일은 Background worker에게 맡긴다. 이렇게 한다면 메모리 누수와 같은 결함으로 시스템 전체의 자원이 동나지 않는 이상 WAS의 파일 처리량을 늘릴 수 있다. 그렇다면 Backgorund worker는 어떻게 자신이 처리해야 할 일을 알 수 있을까? 이 use-case에서는 자...

Clean code TIL 12장. 창발성

이미지
모든 테스트를 실행하라 설계한 의도대로 돌아가는지 검증해야한다. 테스트가 가능한 시스템을 만드려고 애쓸수록 품질이 높아진다. SRP를 준수하는 클래스는 테스트가 더 쉽다. 철저한 테스트가 가능한 시스템을 만들면 더 나은 설계가 얻어진다. 결합도가 높으면 테스트 케이스를 작성하기 어렵다. 테스트 케이스를 만들고 계속 돌리라는 규칙을 준수하면 저절로  낮은 결합도 & 높은 응집력이라는 목표가 달성된다. 리팩토링 리팩터링을 위한 테스트 케이스가 있으므로 코드를 정리하며 시스템이 깨질 염려를 하지 않아도 된다. 중복을 없애라 중복은 추가 작업, 추가 위험, 불필요한 복잡도를 뜻한다. 깔끔한 시스템을 만드려면  단 몇 줄이라도 중복을 제거하겠다는 의지가 필요하다. 가시성이 높아지고 다른 팀원이 다른 맥락에서 재사용할 기회를 포착할 수 있다. 소규모 재사용은 시스템 복잡도를 극적으로 줄여주며 소규모 재사용을 제대로 익혀야 대규모 재사용이 가능하다. * TEMPLATE METHOD 패턴을 참고하자 프로그래머의 의도를 표현하라 1. 좋은 이름을 선택하라 2. 함수와 클래스 크기를 가능한 줄인다. 3. 표준 명칭을 사용한다.     디자인 패턴을 쓴다면, 패턴 이름을 클래스에 넣어준다. 4. 단위 테스트 케이스를 꼼꼼히 작성한다. 5. 주의를 기울이자. 주의는 대단한 재능이다. 클래스와 메서드 수를 최소로 줄인다. 중복 제거, 의도 표현, SRP 준수 등의 개념도 극단으로 치달으면 득보다 실이 많아진다. "가능한 한" 줄이고 무의미할 정도로 작게 만들지 않도록 하자.  * 참 어렵다고 생각한다. 무의미하고 독단적인 정책 탓에 클래스 수와 메서드 수가 늘어나기도 한다. 예 ) 클래스마다 무조건 인터페이스를 생성하는 요구하는 구현 표준 독단적인 정책, 견해보다는 실용을 택하자. 가장 중요한 "경험" 경험을 대신할 단순한 개발 기법은 없다.

Clean code TIL 11장. 시스템

* 11장부터는 노마드 코더 개발자 북클럽 챌린지가 아닌   개인적으로 읽고 작성한 후기입니다.

ML모델 서빙 프레임워크

이미지
<ML 모델 서빙 파이프라인>은 다음 3개의 파트로 나뉜다. 1. 데이터 파이프라인 : 실시간 or 배치로 데이터를 수집 2. 모델 파이프라인 : 모델을 학습시킴 3. 서빙 파이프라인 : 학습된 모델을 서비스로 서빙. 서빙 파이프라인에서는 또 3.1 전처리 3.2 추론  3.3 후처리 을 거쳐 사용자에게 결과를 전달한다. 서빙 파이프라인을 위한 "모델 서빙 프레임워크"에 대해서 정리했다. 모델 서빙 프레임워크 선정 기준 https://tech.kakaopay.com/post/model-serving-framework/#user-content-fnref-1 Warm-up 전, 후 Latency 개선 여부 모델 저장소에 따른 업데이트 방식 Concurrent model execution               여러 개의 모델을 같이 인퍼런스               하나의 모델을 여러 인스턴스로 실행시켜 병렬적으로 인퍼런스 Dynamic Batch 성능 ( Triton )                    Triton 서버에서 동적으로 배치 크기를 만들어 인퍼런스 수행   안정성 : 장시간 인퍼런스 가동시 메모리 누수등의 이슈 * 링크의 포스팅에 따르면 모델 서빙 프레임워크 비교를 위해 모델을 Tensorflow 모델로 고정해서 테스트했다. 다른 모델을 사용한다면 결과가 달라질 수도 있다. * 모델 개발을 하는 머신러닝 리서치는 파이썬으로 모델 서빙 백엔드 개발자는 Kotlin+Spring boot로 서버를 개발했다. * 모델별 최적의 포맷이 다른 상황은 여러 개의 모델을 서빙하는 인공지능 서비스에서 개발 생산성 저하와 운영의 부담을 가중시킨다. 모델 서빙 프레임워크 FastAPI Python F...

노마드코더 개발자북클럽 Clean code 완주, 독후감

이미지
짧은 기간 동안 Java로 쓰여진 클린 코드 책을 읽으며 코드를 짤 때 더 정성을 들여 쓰는 습관을 들였다. 당장 작동하는 코드보다는 유지 보수가 편한, 수정보다는 확장을 할 수 있는, 잘 읽히는, 정직하고, 하나의 일에 몰두하는 그런 코드를 짜려고 했다. 퇴근을 하고 책상 앞에 앉으면 오늘 작성했던 class가 아른거리고 과연 이게 최선이었을까 생각하게 되었다. ========================================================== 책을 읽으면서 대부분 공감하고 고개를 끄덕일 수 있었지만 좋은 코드를 쓰는 법을 아는 것과 좋은 코드를 쓰는 것에는 큰 차이가 있다. 좋은 코드를 쓰는 법을 알기만 해서는 그저 말로만 잘난 체 할 수 밖에 없을 것이다. 좋은 코드를 쓰는 사람은 코드 리뷰를 하며 시스템 변경에 유연한 구조인지 고민한다. 확실히 후자가 더 고된 작업이지만 견고한 프로덕트를 만드는, 실체가 있는 실력이 는다고 생각한다. ========================================================== Java기 반의 코드를 이해하기는 쉽지 않았지만 확실히, Java가 객체 지향적인 장치가 많다고 느꼈다. Python 웹 개발자라면 당장 객체지향 원칙이나 디자인 패턴을 익히기 보다는 웹 애플리케이션 프레임워크를 익히기를 추천한다. 그 중에서도, FastAPI를 추천하는데 Layer와 Depends를 사용한 설계 장치를 사용하며 실전 감각을 기르면서 객체지향적인 사고를 할 수 있다. 혼자 상향식으로 배우기 버겁다면 Framework의 규칙을 따르며 배워나가는 것이 효율적이라고 생각한다. 그리고 이렇게 해야 실전 감각을 느낄 수 있다. ========================================================== 클린 코드 북클럽 챌린지 덕분에 오늘도 나는 하나의 괴이한 모듈을 처리했다. util 패키지의 fileutil이라는 모듈인데 온갖 잡다한 파일 처리를 다 도맡아 하...

노마드코더 개발자북클럽 Clean code Mission(2) : 예시 만들기

Python 리팩토링 원칙1과 예시 원칙 1. Dependency Inversion Principle 클래스는 상세한 구현이 아닌 추상화에 의존해야 한다. [before] class Pedal:     def __init__(self, _type:str):          self.pedal_type = _type     def get_pressure(self)->int:            if self.pedal_type == 'accelerator':               sensor = AcceleratorSensor()               pressure = sensor.copy_pressure_buffer()                # do something           elif self.pedal_type == 'brake':             sensor = BrakeSensor()             pressure = sensor.copy_pressure_buffer()             # do something          elif self.pedal_type == 'clu...

Before coding in vue.js

UI 개발을 위한 Progressive Framework, vue.js "Progressive" of vue.js Web, 네이티브 앱(ios, android)의 이점을 모두 수용하여 표준적인 패턴으로 개발함. 제공하는 웹 사이트의 특징에 따라 개발 방식도 달라져야하기 때문. 데이터 지향 화면을 렌더링하는 구조 자체는 dom이 아니라 javascript다. 데이터가 먼저 존재하고 데이터를 기반으로 적절한 dom을 구축한다. Two way 데이터 바인딩 데이터와 렌더링을 동기화하는 구조를 가진다. UI 패턴이 많아지면 dom을 변경하는 코드가 많아진다. vue에서는 dom 변경 작업을 vue 프레임워크에 맡긴다. html dom과 데이터가 서로 양방향으로 연결되어 있어서 어느 한쪽에 변경이 일어나면, 다른 쪽에 자동으로 반영된다. 이를 통해 휴먼 에러와 코딩양 자체를 줄일 수 있다. v-directive 속성 가상 dom을 만들기 위한 템플릿 기법. Dom에 반영하기 전에 vue.js 프레임워크에 의해 컴파일 되고 내부적으로만 사용한다. ex) v-if, v-bind, key 데이터 바인딩과 관련된 처리를 실시한다. html속성과 다르게 v-디렉티브는 애플리케이션에 등록되어 있는 데이터 전용 객체의 속성을 나타낸다. Mount 배치할 요소와 애플리케이션을 연결하는 것. 컴포넌트 기능별로 html/js/css 세트로 구성할 수 있다. 컴포넌트를 조합하면 페이지를 구조화하여 만들 수 있다. vue.js를 통해 부품을 만들고 vuex를 통해 부품들로 구성된 페이지를 만들고 vue router를 통해 여러 개의 페이지를 관리한다. 가상dom 작은 변화가 발생 해도 DOM 트리 구조 모두 갱신하기보다, 추상화된 dom문서로부터 가상의 DOM에서 메모리에서 처리 후 실제 DOM과 동기화.(실제 DOM갱신) 1. 데이터 변경과 실제 dom변경 처리는 비동기적으로 이뤄진다.     dom조작을 최소한으로 유지하므로 렌더링 성능이 높다. 2. 그러나 dom 재...

이 블로그의 인기 게시물

실무진 면접 경험으로 정리하는 백엔드 (1) : 에듀 테크 기업 면접

노마드코더 개발자북클럽 Clean code 완주, 독후감

Blogger 커스터마이징 : CSS 수정 (sticky-header)