분류 전체보기(38)
-
uv 사용해보기
MCP를 공부하다가 uv 라는 것을 알게되었다. 어릴적 아이리버 MP3를 뜨겁게 달구던 그 UV 가 아니다. 파이썬 패키지 및 프로젝트 관리 도구이다. uv란 뭘까? uv를 알려면 우선 Rust를 먼저 알아야 한다. 파이썬은 배우기 쉽지만 느리다. C는 빠르지만 메모리 관리가 어렵다. 뭐 이런 프로그래밍 언어들의 장점들을 뽑은게 Rust이다. 마치 국 끓이기 좋게 맛있는 것만 모아 놓은 '코인 육수' 같은 놈이다. 이 Rust로 만든 맛있는 된장찌개가 바로 uv 이다. 기존 파이썬 환경은 가상환경을 생성하고 pip 설치가 굉장히 불편하고 느리다. requirements를 직접 작성 해야하고, pip는 파이썬으로 짜여져있어서 의존성 해석과 설치가 느리다. 이렇기에 이 가상환경을 어디로 옮기려고 한다면 엄청..
2025.08.29 -
Multi-Stage Speaker Diarization for Noisy Classrooms(27 May 2025)
* 원문 논문 아카이브https://arxiv.org/abs/2505.10879 Multi-Stage Speaker Diarization for Noisy ClassroomsSpeaker diarization, the process of identifying "who spoke when" in audio recordings, is essential for understanding classroom dynamics. However, classroom settings present distinct challenges, including poor recording quality, high levels of background noarxiv.org Abstract교실 환경은 녹음 품질 저하, 높은 수준의배경 잡..
2025.08.17 -
NeMo Multi-Scale Diarization Decoder
Speaker Diarization Task는 정말 어려운 분야 같다. 괜찮은 모델을 찾고 파인튜닝을 해도 오디오의 음질이나 도메인에 너무 큰 영향을 받는다. 도출된 결과로 LLM을 통해 회의록을 만들기라도 하면 화자 분리가 하나라도 잘못되면 재수 없게 회의록은 엉망이 되고 만다. 그러던 중 상당히 흥미로운 모델을 찾았다. NeMo Framework에 Speaker Diarization이다. 'Multi-Scale Diarization Decoder' 이란 명칭이 붙어있고 논문에 따른 성능이나, 도메인에 따른 Pretrained Model 지원 여부, 편리한 학습을 제공한다. 많은 곳에서 그 동안은 많은 곳에서 그랬던 것처럼 Pyannote를 파인튜닝 후 사용 중이었는데 결과가 놀랍다. 논문https:/..
2025.08.12 -
갤럭시 폴드 7과 워치 8
최근 서비스 런칭을 위해 매우 바쁜 직장 일과 더불어 개인적으로 민형사 고소로 인해 블로그에 글을 투고 하지 않았다. 세 가지의 취미였던 헬스, 공부(블로그), 데이트 중 데이트를 제외하고 모든 것을 잃은 몇 달이었다. 인생을 취미와 더불어 온 사람이라 취미를 잃으면 스트레스를 받는다. 난스트레스를 받으면 체중이 감소하고 과소비를 하게 된다. 결론적으로 난 12kg을 잃었고 폴드 7과 워치 8을 얻었다. 나의 스마트폰 일대기는 뭐 그리 길지 않다. 갤럭시 노트 4를 시작해 갤럭시 S7+, 아이폰 12 프로, 아이폰 SE 3 세대를 썼었다. 대체로 큰 화면을 선호하던 나였지만 올해 1월 아이폰 SE로 회귀 해버렸다. 아이폰 12 프로는 정말 좋은 폰 이었다. 갤럭시만 쓰던 나에게 ios를 알게 해주었고, ..
2025.08.10 -
파이썬에서 깔끔하게 임시 파일 관리하기
파이썬으로 코딩 하다보면 임시 파일을 만들고 삭제해야할 때가 많다. 특히 음성 AI에 종사해 있는 나는 원음의 특정 구간을 청킹해 저장 후 다른 곳에서 사용하곤 한다. Numpy Array 형태로 직접 활용하면 좋지만 대부분의 라이브러리에서는 오디오의 경로를 직접 받게 되어 있어 곤란할 때가 많다. 이럴 때 굳이 temp 경로를 지정하고 직접 삭제를 해야할까? 그동안.. 우선 그동안 내가 했던 방식을 확인해보겠다. 임시 파일 경로를 미리 지정해주고, pydub 라이브러리를 사용해 0.1초 단위로 청킹해 저장 후 시간을 비교해보겠다. 코랩에서 진행해보겠다.from pydub import AudioSegmentimport osimport timefrom tqdm import tqdmaudio_path = '..
2025.08.10 -
Supabase DB 사용해보기
최근 개인 프로젝트 때문에 개발 랩탑에 DB를 설치한적이 있다. 사실 DB 쪽은 잘 모른다. 물론 기본적인 쿼리문이나 지켜야할 사항들 등 베이직한 지식들은 알지만 친하지는 않다. 그래서 그런지 설치가 잘되지 않았다. 이유는 뭔지 모르겠다. 방화벽 문제인것 같은데 하다가 스트레스 받아서 포기했다. 그래서 데이터들을 csv와 pandas로 관리하고 있었다. 너무 초보적이라 부끄러웠다. 그러던중 재미있는 서비스를 발견했다. 바로 'Supabase' 이다. Firebase와 비슷한 PostgreSQL 기반 웹 DB 플랫폼이다. 무료이고, 관리가 쉽고, 사용하기 편하다고 한다. 오호라. 그럼 내가 안써볼 수 없다. 바로 써보겠다.https://supabase.com/ Supabase | The Postgres D..
2025.07.06