분류 전체보기 140

[LLM] Finetuning – 파인튜닝과 메모리 병목의 해결 방법

파인튜닝의 현실적인 문제: 메모리 병목(Memory Bottlenecks)파인튜닝이 강력한 기능을 제공함에도 불구하고, 가장 큰 현실적 제약은 바로 GPU 메모리 사용량입니다. 파인튜닝 중에는 모델이 예측을 수행하는 것뿐만 아니라, 오차를 계산하고 가중치를 수정하는 과정(backpropagation)까지 포함되기 때문에, 추론보다 훨씬 많은 메모리를 소모하게 됩니다.요약: 메모리 병목을 이해하기 위한 핵심 포인트Key Takeaways for Understanding Memory Bottlenecks파인튜닝은 추론보다 훨씬 높은 메모리를 요구합니다.모델이 결과를 출력하는 것만 필요한 추론(inference)과는 달리, 파인튜닝은 전체 파라미터를 업데이트하기 위해 두 배 이상의 메모리가 필요합니다.메모리 ..

[LLM] Finetuning – 파인튜닝과 RAG의 관계

파인튜닝 vs RAG – 언제 무엇을 선택할까?파인튜닝(Finetuning)과 RAG(Retrieval-Augmented Generation)는 모두 모델 성능을 향상시키는 대표적인 방법입니다. 하지만 두 접근법은 목적과 활용 방식에서 본질적인 차이를 갖고 있습니다.핵심 정리는 이렇습니다:“파인튜닝은 형식(Form)을 위해, RAG는 사실(Fact)을 위해”정보 기반 실패에는 RAG가 효과적입니다만약 모델이 정답을 알고 있지 않아서 틀리는 경우라면, 파인튜닝보다는 RAG가 더 효과적입니다. 예를 들어:모델이 정보를 모르는 경우: 조직 내부 데이터, 최신 뉴스, 논문 등은 기존 모델이 사전학습 시점에 포함하지 못한 경우가 많습니다. 이럴 땐 외부 검색 기반의 RAG가 효과적입니다.모델이 오래된 정보를 가지..

[LLM] Finetuning – 파인튜닝의 정의 및 도입 시기

AI 모델을 특정 작업에 더 잘 맞추기 위해 가장 널리 사용되는 방법 중 하나는 바로 파인튜닝(Finetuning)입니다. 이는 기존의 사전학습(pretraining)된 모델을 기반으로, 전부 또는 일부를 추가 학습시켜 특정한 목적이나 도메인에 특화되도록 조정하는 과정을 말합니다.왜 파인튜닝이 중요한가요?파인튜닝은 단순한 성능 향상만을 의미하지 않습니다. 특히 다음과 같은 이유로 주목받고 있습니다.도메인 특화(Domain-Specific) 기능 향상: 예를 들어, 의료, 법률, 코딩 등 특정 분야에 특화된 질문에 더 정확히 답변하도록 모델을 조정할 수 있습니다.지시 수행 능력 개선(Instruction Following): 사용자가 제시한 특정 포맷, 스타일, 요구사항에 따라 더 잘 응답하도록 모델을 세..

[딥러닝] Flux.1 파인튜닝 모델 Chroma의 특징 및 아키텍쳐 설명 가이드

Chroma는 FLUX.1-schnell에서 파생된 8.9B(89억) 파라미터 모델로, 접근성과 자유, 혁신을 최우선으로 하는 강력한 오픈 소스 AI 모델입니다. Apache 2.0 라이선스로 출시되어 누구나 자유롭게 사용할 수 있으며, 수정 및 확장이 가능하고 기업의 제약 없이 활용할 수 있습니다.현재 오픈소스로 공개가 되어있고 학습 중인 Chroma는 방대한 데이터셋을 활용하여 생성형 AI의 한계를 확장하는 것을 목표로 하고 있다고 합니다. 이번 블로그에서는 Chroma 프로젝트의 목표, 기술적 혁신, 모델 구조, 그리고 오픈 소스 커뮤니티와 협력하는 방법을 자세히 살펴보겠습니다.Chroma의 목표Chroma는 2천만 개의 원본 샘플 중 5백만 개의 고품질 데이터를 엄선하여 학습되었습니다. 데이터셋에..

[LLM] AI Agent의 메모리 시스템 관리 및 데이터 구조화

1. AI 에이전트의 정보 계층 구조AI 에이전트는 다양한 유형의 정보를 계층적으로 저장하고 활용함.AI 에이전트의 정보 계층 구조내부 지식(Internal Knowledge): 사전 학습된 데이터단기 메모리(Short-term Memory): 현재 세션 내에서 유지되는 정보장기 메모리(Long-term Memory): 여러 세션 동안 유지되는 외부 데이터결론자주 사용하는 정보는 내부 지식으로 저장하고, 세션별 임시 정보는 단기 메모리로 관리장기적으로 저장할 필요가 있는 데이터는 외부 저장소(예: 데이터베이스)에서 관리2. 메모리 관리의 핵심 요소1. 세션 내 메모리 오버플로우 방지 (Manage Memory Overflow within a Session)AI가 새로운 정보를 많이 저장하면, 최대 컨텍스..

[LLM] AI Agent의 효율성(Efficiency) 및 메모리(Memory) 시스템

1. AI 에이전트의 효율성(Efficiency) 평가AI가 유효한 계획(Valid Plan)을 생성할 수 있어도, 반드시 효율적인 것은 아님!효율적인 AI는 더 빠르고 비용이 적게 들며, 불필요한 연산을 최소화해야 함효율성 평가 지표 (Efficiency Metrics)AI가 평균적으로 몇 개의 단계를 거쳐 작업을 완료하는가?너무 많은 단계를 거친다면, 최적화 필요!AI가 평균적으로 작업을 완료하는 데 드는 비용은 얼마인가?API 호출 비용, 연산량 등을 고려해야 함AI가 작업을 완료하는 데 걸리는 시간은 어느 정도인가?특정 단계가 과도하게 오래 걸린다면, 이를 단축하는 방법을 고민해야 함예제웹 페이지 크롤링 작업사람 기준: 한 번에 한 페이지씩 방문해야 하므로, 10개 페이지를 읽는 것은 시간이 오래..

[LLM] AI Agent의 실패 유형 및 평가 방법

1. AI 에이전트의 실패 유형 (Agent Failure Modes)AI 에이전트의 성능은 도구 사용 능력과 계획 수립 능력에 따라 결정됨.실패 유형 (Failure Modes)계획 실패(Planning Failures) → 잘못된 계획 생성도구 실패(Tool Failures) → 잘못된 도구 호출번역 오류(Translation Errors) → 계획을 실행 가능한 명령으로 변환하는 과정에서 발생실패율 분석이 중요한 이유AI의 성능을 평가하려면 어떤 실패가 자주 발생하는지 측정해야 함실패 원인을 분석하면 모델 개선 방향을 찾을 수 있음2. 계획 실패 (Planning Failures)계획(Planning)은 어려운 작업이며, 다양한 오류가 발생할 수 있음.계획 실패 유형잘못된 도구 호출 (Invalid..

[LLM] AI Agent의 도구 사용 패턴 및 도구 확장 전략

1. AI 에이전트의 도구 사용 패턴 분석📌 AI 모델은 수행하는 작업(Task)에 따라 서로 다른 도구를 사용함✅ 실험 결과 (Lu et al., 2023):1️⃣ 다양한 작업(Task)에는 서로 다른 도구가 필요예제:ScienceQA(과학 문제 풀이) → 지식 검색(Knowledge Retrieval)에 의존TabMWP(수학 문제 해결) → 수식 변환(Column Lookup, Table Verbalizer) 사용2️⃣ 다른 AI 모델은 서로 다른 도구 선호도를 보임ChatGPT → 이미지 캡셔닝(Image Captioning) 도구를 선호GPT-4 → 지식 검색(Knowledge Retrieval) 도구를 더 많이 사용📌 결론:AI 에이전트가 수행하는 작업 유형에 따라 필요한 도구가 달라진다특정..

카테고리 없음 2025.03.06

[LLM] AI Agent의 반성적 사고(Reflection) 적용 및 도구 선택(Tool Selection) 전략

1. ReAct 프레임워크 적용 예제📌 ReAct(Reason + Act) 프레임워크는 AI가 작업을 수행하면서 "이유(Reasoning) + 행동(Acting) + 평가(Reflection)"를 반복하도록 설계된 방식✅ 예제: AI가 "Apple Remote와 함께 작동할 수 있는 다른 기기는 무엇인가?"라는 질문에 답하는 과정Thought 1: "Apple Remote의 원래 목적을 검색해야 함" → 검색 수행Thought 2: "Front Row(소프트웨어)가 관련 있음" → 추가 검색 필요Thought 3: "Front Row는 존재하지 않음" → 대체 검색 수행Thought 4: "Front Row(소프트웨어)는 Apple Remote와 함께 작동하며, 키보드 기능 키를 제어함" → 최종 답변..

[LLM] AI Agent의 제어 흐름(Control Flow), 반성적 사고(Reflection), 및 오류 수정(Error Correction)

1. AI 에이전트의 제어 흐름(Control Flow) 패턴📌 AI 에이전트가 계획을 실행할 때, 다양한 방식으로 작업을 수행할 수 있음✅ AI 계획 실행의 다양한 순서 예제제어 흐름 유형설명 예제순차적(Sequential)작업 A가 완료된 후 작업 B 실행자연어를 SQL 쿼리로 변환 후 실행병렬(Parallel)여러 작업을 동시에 수행100개 제품의 가격을 동시에 가져오기조건문(If Statement)특정 조건에 따라 작업 경로 결정주가 분석 후 매수/매도 결정반복문(For Loop)특정 조건이 충족될 때까지 실행소수를 찾을 때까지 숫자 생성💡 실제 적용 예제:AI가 두 개의 웹사이트를 동시에 크롤링해야 한다면, 병렬 실행(Parallel Execution)이 필요AI가 주가 변동을 분석한 후 매..