Haru's 개발 블로그

[LLM] AI Agent의 계획 세분화(Granularity), 복잡한 계획 처리, 및 제어 흐름(Control Flow)

1. 계획 세분화(Planning Granularity)란?📌 AI의 계획(Plan)은 다양한 수준(Level of Granularity)에서 생성될 수 있음.연 단위 계획 → 가장 상위 수준분기별(Quarterly) 계획 → 중간 수준월별(Monthly) 계획 → 더 세부적인 수준주별(Weekly) 계획 → 가장 낮은 수준✅ 세분화된 계획의 장단점계획 수준장점 단점고수준 계획 (High-Level)생성이 빠름, 간단함실행하기 어려움 (상세 정보 부족)세부 계획 (Detailed Plan)실행이 용이생성하는 데 시간이 오래 걸림, 복잡성 증가💡 해결책:AI가 먼저 고수준 계획을 생성한 후, 세부적인 하위 계획을 단계적으로 추가하는 방식 사용예제:1️⃣ 분기별 계획 생성 → 2️⃣ 각 분기에 대한 월별..

머신러닝 & 딥러닝/LLM 2025.03.06

[LLM] AI Agent의 계획 향상 및 함수 호출(Function Calling) 개념

1. AI의 계획 능력 향상 방법📌 AI 에이전트가 더 나은 계획(Planning)을 세우려면 다음과 같은 개선이 필요함✅ 1️⃣ 프롬프트 최적화 (Prompt Engineering)더 많은 예제를 제공하여 AI가 패턴을 학습할 수 있도록 함예제 기반 학습 (Few-shot learning)을 활용하여 성능 향상 가능✅ 2️⃣ 도구 및 매개변수 설명 강화도구의 기능과 필요한 매개변수(Parameter)를 명확하게 설명예제:❌ "convert_units" → AI가 이 함수가 무엇을 변환하는지 이해하기 어려움✅ "convert_lbs_to_kg" → AI가 명확하게 기능을 이해할 수 있음✅ 3️⃣ 복잡한 함수를 단순화 (Refactoring Complex Functions)하나의 함수가 너무 많은 역할을..

머신러닝 & 딥러닝/LLM 2025.03.06

[LLM] 기반 모델(FM) vs. 강화 학습(RL) 플래너 및 계획 생성(Plan Generation)

1. 기반 모델(FM) vs. 강화 학습(RL) 플래너📌 FM(Foundation Model)과 RL(Reinforcement Learning) 에이전트의 차이점✅ 기반 모델(FM) 플래너:대형 언어 모델(LLM) 기반프롬프트 엔지니어링을 통해 계획을 생성일반적으로 사전 학습된 모델을 활용즉시 활용 가능하지만, 계획 성능이 최적화되지 않을 수 있음✅ 강화 학습(RL) 플래너:강화 학습을 통해 지속적으로 성능이 개선됨환경과 상호작용하며 최적의 계획을 학습훈련에 많은 데이터와 시간이 필요특정 작업에 맞춘 최적화가 가능💡 결론:FM 플래너는 즉시 사용 가능하지만, RL 플래너는 장기적으로 더 최적화된 결과를 제공미래에는 FM과 RL 플래너가 결합하여 더욱 강력한 AI 시스템이 탄생할 가능성이 높음2. 계획..

머신러닝 & 딥러닝/딥러닝 2025.03.06

[LLM] AI Agent의 계획(Planning)과 LLM의 한계

1. AI 에이전트의 자동화된 계획 및 실행 과정📌 AI 에이전트는 복잡한 작업을 수행할 때 3단계 프로세스를 따름:✅ 1️⃣ 계획 생성 (Plan Generation)AI가 문제를 해결하기 위한 실행 가능한 계획(Plan)을 생성일반적으로 작은 하위 작업(Task Decomposition)으로 나눠서 처리✅ 2️⃣ 계획 검토 및 오류 수정 (Reflection & Error Correction)생성된 계획을 평가하고 비효율적인 경우 새로운 계획을 다시 생성✅ 3️⃣ 실행 (Execution)검토된 계획을 기반으로 실제 실행 (예: API 호출, SQL 실행, 코드 실행 등)✅ 4️⃣ 실행 결과 검토 및 수정 (Reflection & Error Correction)실행 후 결과를 검토하여 목표 달성이 ..

머신러닝 & 딥러닝/LLM 2025.03.05

[LLM] AI Agent의 계획(Planning)과 실행(Execution) 분리 전략

1. AI 에이전트의 계획(Planning) 개요📌 복잡한 작업을 수행하는 AI 에이전트는 먼저 "계획(Plan)"을 세운 후 실행해야 한다.AI가 적절한 방법을 선택하지 않으면, 비효율적인 방식으로 문제를 해결하려 할 가능성 증가따라서, "무엇을 할 것인가?"(Planning)와 "어떻게 실행할 것인가?"(Execution)는 분리하는 것이 이상적✅ 계획을 잘못 세우면 실행 과정이 비효율적이 될 수 있음예제: "1조 달러 이상 투자금을 유치한 회사를 찾아라"❌ 비효율적인 방법:모든 기업을 검색한 후 "수익 없음" 필터를 적용 → 검색 범위가 너무 넓어짐✅ 효율적인 방법:1조 달러 이상을 유치한 기업만 검색한 후, 수익이 없는 기업을 필터링 → 검색 범위를 축소하여 빠른 결과 도출📌 결론:AI가 계획..

머신러닝 & 딥러닝/LLM 2025.03.05

[LLM] AI Agent의 기능 확장: 멀티모달 처리, 코드 해석, 쓰기 액션(Write Actions) 및 보안 고려

1. AI 에이전트의 기능 확장 (Capability Expansion for AI Agents)📌 AI 모델은 특정 기능(예: 계산, 번역, 코드 실행)에 약할 수 있다.✅ 해결책: 외부 도구를 활용하여 기능을 확장하는 방식💡 예제: 기본적인 AI의 한계 해결하기수학 계산이 약한 AI → 계산기 API(Wolfram Alpha) 연동번역 기능 부족 → 다국어 번역 API 연결코드 실행 불가능 → 코드 인터프리터(Code Interpreter) 도구 추가🔥 도구를 추가하면 AI의 활용성이 급격히 증가! 🚀2. AI의 멀티모달 처리(Multimodal AI Processing)📌 기존 AI 모델은 텍스트만 처리 가능하지만, 멀티모달 기능을 추가하면 더 강력한 AI가 된다!🔹 텍스트 전용 AI를 ..

머신러닝 & 딥러닝/LLM 2025.03.05

[LLM] AI Agent의 도구(Tools)와 기능 확장(Knowledge Augmentation & Capability Extension)

1. AI 에이전트의 작업 수행 과정📌 AI 에이전트는 복잡한 작업을 수행하며, 여러 단계의 의사결정을 거친다.예제: "향후 3개월 동안의 매출을 예측하라"라는 요청을 처리하는 AI 에이전트의 단계1️⃣ 필요한 정보 확인기존 데이터만으로 예측이 부족하다고 판단과거 마케팅 캠페인 데이터도 필요하다고 결정2️⃣ SQL 쿼리 생성 (Query Generation)과거 마케팅 데이터를 검색하는 SQL 쿼리를 작성3️⃣ SQL 쿼리 실행 (Query Execution)생성된 쿼리를 실행하여 데이터를 가져옴4️⃣ 결과 분석 및 예측 생성가져온 데이터를 바탕으로 매출 예측 수행5️⃣ 작업 완료 여부 판단필요한 모든 정보를 확보했는지 검토✅ 결론:에이전트는 단순한 질문-응답 시스템이 아니라, 복잡한 문제 해결을 위한..

머신러닝 & 딥러닝/LLM 2025.03.05

[LLM] AI 에이전트(Agents): RAG를 넘어 자율적인 AI 시스템으로

1. AI 에이전트 개요 (Agent Overview)📌 에이전트(Agent)란?"환경을 인식하고 그에 따라 행동할 수 있는 시스템" (Russell & Norvig, 1995)✅ AI 에이전트의 핵심 개념환경(Environment) → 에이전트가 상호작용하는 공간 (예: 인터넷, 파일 시스템, 데이터베이스 등)행동(Actions) → 에이전트가 수행할 수 있는 작업 (예: 검색, SQL 실행, 데이터 분석)📌 예제: 다양한 유형의 AI 에이전트에이전트 유형환경수행 가능한 작업게임 에이전트게임 세계 (Minecraft, Go, Dota)게임 내에서 자동 행동웹 스크래핑 에이전트인터넷웹에서 정보 수집요리 로봇주방요리 수행자율주행 에이전트도로 시스템차량 운전RAG 에이전트검색 엔진, 데이터베이스정보 검색..

머신러닝 & 딥러닝/LLM 2025.03.05

[LLM] RAG의 확장: 구조화된 데이터(Tabular Data)와 에이전트(Agents)

1. 구조화된 데이터(Tabular Data) 기반 RAG📌 일반적인 RAG 시스템은 비정형 데이터(텍스트, 이미지)를 활용하지만, 많은 비즈니스 애플리케이션은 정형 데이터(테이블, 데이터베이스)를 필요로 한다!💡 문제점:일반적인 RAG 시스템은 주로 문서, 이미지 등의 비정형 데이터를 검색하지만 이커머스, 금융, 헬스케어 등의 분야에서는 구조화된 데이터(테이블, SQL 데이터베이스)가 핵심 정보원✅ 해결책: RAG + SQL 기반 검색(Text-to-SQL)자연어 질문을 SQL 쿼리로 변환하여 데이터베이스에서 정량적 정보를 검색검색된 데이터를 바탕으로 AI가 답변을 생성2. 예제: 이커머스 데이터베이스에서 판매량 검색📌 데이터 예시 (Table 6-3: Kitty Vogue의 판매 데이터)이커머스..

머신러닝 & 딥러닝/LLM 2025.03.05

[LLM] RAG의 확장: 문서 기반 검색을 넘어 멀티모달 RAG로

1. RAG 시스템의 컨텍스트 확장 (Contextual Augmentation in RAG)📌 컨텍스트 보강(Context Augmentation)이란?"검색된 문서의 청크에 짧은 컨텍스트를 추가하여 검색 정확도를 향상시키는 기법"💡 문제점:검색된 문서의 일부 청크(Chunk)만 보면 문맥을 이해하기 어려울 수 있음AI 모델이 올바른 정보를 제공하려면, 검색된 청크가 전체 문서에서 어떤 역할을 하는지 알 필요가 있음📌 해결 방법:각 청크에 짧은 문맥(Context)을 추가하여 검색 엔진이 더 정확한 결과를 반환할 수 있도록 함Anthropic의 접근 방식각 청크 앞에 해당 청크의 의미를 설명하는 컨텍스트 요약을 추가이 보강된 청크를 검색 시스템이 인덱싱✅ 결과:검색된 문서가 더 유의미한 결과를 제..

머신러닝 & 딥러닝/LLM 2025.03.05

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Haru's 개발 블로그

전체 글 140

티스토리툴바