5-에이전트 이사회를 8-에이전트 운영 체제로 재구축했습니다 — 그런 다음 200편의 논문을 영구적으로 쿼리하는 문헌 인텔리전스 엔진을 추가했습니다.
v1은 이사회 토론이었습니다. v2는 완전한 파이프라인입니다: 소스가 수집되고 정리되고, 아무도 말하기 전에 격차가 감지되고, 모든 주장에 소스가 요구되며, 편향 감시자가 인간이 놓치는 것을 잡아냅니다. 추가: Read Once Query Forever v2가 논문 컬렉션을 쿼리 가능한 지식 시스템으로 변환합니다. 아래 무료 마스터 프롬프트 2개.
시스템 1: 라운드 테이블 v2 — 8개 에이전트, 3라운드, 3개 검증 게이트. 시스템 2: Read Once Query Forever v2 — 4개 에이전트, 지식 그래프, 무한 쿼리. 둘 다 PPAE 사용. 둘 다 무료.
PPAE 파이프라인: 4단계, 8개 에이전트, 환각 주장 제로
v1은 평평한 3라운드 토론을 실행했습니다. v2는 그 토론을 먼저 모든 주장을 실제 소스에 그라운딩하고, 그런 다음 아무도 말하기 전에 누락된 것을 감지하고, 그런 다음 점수화된 게이트에 대해 모든 출력을 검증하고, 마지막으로 편향을 감사하고 다음을 위해 학습을 저장하는 4단계 파이프라인으로 감쌉니다.
이 동일한 PPAE 프레임워크가 이 페이지의 두 시스템을 구동합니다: 라운드 테이블 v2(건설적 — 산출물을 구축)와 Read Once Query Forever v2(인텔리전스 — 논문을 지식으로 변환).
v2가 v1으로는 만들 수 없었던 것
PPAE 아키텍처는 범용입니다 — 에이전트가 과제에 적응합니다. 두 시스템, 하나의 프레임워크.
비즈니스 피치
에이전트 6이 트랙션 데이터 + 시장 보고서를 수집합니다. 에이전트 1이 모든 지표를 명명된 소스에 그라운딩합니다. 에이전트 3이 확증 편향을 잡습니다. 에이전트 4가 들어가기 전에 모든 VC 반대 의견을 발언합니다.
그랜트 제안
에이전트 6이 논문 + RFA 요구사항을 처리합니다. 에이전트 2가 목표를 검토 기준에 매핑합니다. 에이전트 3이 편향 감사를 실행합니다. 에이전트 7이 페이지 제한 및 규정 준수 체크리스트에 대해 검증합니다.
문헌 리뷰
4개 전문 에이전트가 논문 컬렉션을 수집하고, 지식 그래프를 구축하고, 모순과 격차를 감지하고, 인용과 함께 질문에 답변합니다. 영구적으로 쿼리, 동일한 지식 기반.
전체 워크플로우
라운드 테이블이 산출물을 구축합니다. 파이팅 아레나가 모든 약점을 찾습니다. 라운드 테이블이 수정합니다. 아레나가 검증합니다. Read Once Query Forever가 증거 기반을 공급합니다.
v1의 토론이 충분하지 않았던 이유
v1은 방에서 논쟁하는 5개 에이전트를 제공했습니다. 그것은 하나의 긴 프롬프트를 가진 하나의 AI에서 대규모 업그레이드였습니다. 하지만 세 가지 치명적 약점이 있었습니다: 에이전트가 데이터를 자유롭게 환각, 품질이 불일관, 시스템이 학습하지 않음.
v2는 세 가지를 모두 수정합니다. 모든 주장에 소스 ID와 신뢰도 평가가 필요합니다. 세 개의 점수화된 검증 게이트가 나쁜 출력을 차단합니다. 메모리 시스템이 학습을 축적하여 10번째 피치가 1번째보다 극적으로 나아집니다.
토론에서 검증된 파이프라인으로. 환각 데이터에서 RAG 기반 근거로.
- RAG 그라운딩이 환각을 제거합니다. 에이전트 6이 실제 소스를 수집합니다. 에이전트 1이 하는 모든 주장은 소스 ID로 태그됩니다. 소스 없음 = 에이전트 3에 의해 거부.
- 검증 게이트가 일관성을 강제합니다. 세 개의 스테이지 게이트(임계값 60/70/75)가 나쁜 출력을 차단합니다. 바이브 체크가 아닌 점수화된 품질 보고서를 받습니다.
- 편향 감사가 당신이 볼 수 없는 것을 잡습니다. 에이전트 3이 확증 편향, 생존자 편향, 앵커링, 권위 편향, 가용성 편향, 프레이밍 편향을 검사합니다.
- 자가 복구가 실패에서 복구합니다. 게이트가 실패하면 시스템이 오류를 분류하고, 특정 에이전트를 대상으로 하고, 재프롬프트하고, 재검증합니다. 최대 3회 시도.
- 메모리가 세션 간에 축적됩니다. 에이전트 8이 효과가 있던 전략, 반복된 반대 의견, 개인 패턴을 저장합니다. 50번째 세션은 1번째 세션보다 극적으로 나아집니다.
8개 에이전트: 핵심 5개 + v2 신규 3개
시스템 아키텍처: 레이어가 연결되는 방식
v1 vs v2: 무엇이 바뀌었고 왜 중요한가
| 차원 | v1 | v2 | 영향 |
|---|---|---|---|
| 에이전트 | 범용 5개 | 8개 (핵심 5개 + 신규 3개) | +60% 커버리지 |
| 소스 처리 | 수동, 처리 없음 | 자동 수집, 정리, 버전 관리, 신뢰도 | 환각 제로 |
| 증거 | 에이전트가 자유롭게 환각 | 모든 주장: 소스 ID + 신뢰도 | 검증 가능한 주장 |
| 검증 | 구두 비판만 | 3개 점수화된 스테이지 게이트(60/70/75) | 일관된 품질 |
| 편향 감지 | 없음 | 6가지 유형 편향 감사 프로토콜 | 사각 지대 포착 |
| 오류 복구 | 없음 (사용자 재프롬프트) | 자가 복구: 감지 → 복구 → 검증 | 98.8% 성공률 |
| 메모리 | 없음 | 4레이어 기판 | 시간에 따라 학습 |
| 격차 감지 | 없음 | 구조화됨 + 리서치 트리 | 사전 예방적 |
| 문헌 | 지원 안 됨 | Read Once Query Forever v2 | 200편 논문 → 쿼리 가능 |
나쁜 출력을 차단하는 3개 검증 게이트
실습 예제: 전체 파이프라인 실행 보기
Phase 1: 인지
에이전트 6이 7개 소스를 수집합니다: 업계 보고서 3개, 내부 지표 스프레드시트 1개, 경쟁사 가격 페이지 3개. 평균 신뢰도 8.4/10의 소스 레지스트리를 생산합니다. 지식 격차 플래그: 고객 사례 연구 없음, 팀 문서 누락.
Phase 2: 계획
에이전트 2가 태스크 청사진을 생성합니다: "엔터프라이즈 SaaS VC로부터 $3M 시리즈 A." 5개 분기에 걸쳐 12개 격차를 식별합니다. 리서치 트리가 85% 시장 증거 커버리지, 70% 트랙션 커버리지를 보여줍니다.
Phase 3: 라운드 1
에이전트 2: 4개 전략. S-001: 포지셔닝 = "연간 $454K 절감." S-003: 해자 = "데이터 플라이휠" (네트워크 효과 아님 — 고객 12명뿐).
에이전트 3: 5개 비판. CR-001 [높음]: "99.2% 정확도" 미검증. CR-003 [높음]: "네트워크 효과"는 가설, 증거 아님.
에이전트 4: 4개 반대 의견. O-001 [딜킬러]: "SAP가 왜 당신을 짓밟지 않을까요?" 답변: 누락.
Phase 3: 라운드 2
토론 2: 에이전트 3이 "네트워크 효과"를 공격합니다. "고객 12명은 파일럿이지 네트워크가 아닙니다." 해결: "데이터 플라이휠"로 다운그레이드.
토론 4: 에이전트 4가 딜킬러(SAP)를 제기합니다. 에이전트 2가 경쟁 슬라이드를 제안합니다. 에이전트 3이 고객 인용을 요구합니다.
편향 감사: 확증 편향 보통(기회만 강조). 생존자 편향 보통(성장만 표시). 둘 다 해결됨.
Phase 3: 라운드 3 + Phase 4: 평가
에이전트 5가 12장 피치 구조를 생산합니다. 전체 점수: 83/100, 중간-높음 신뢰도. 저장된 세션 학습: L-005: 절감 숫자로 리드. L-006: 고객 12명에서는 "네트워크 효과"가 시기상조. L-007: 리스크 슬라이드가 신뢰도를 강화.
Phase 1: 인지
에이전트 6이 22개 소스를 수집합니다: 논문 15편, NIH RFA, 예비 데이터, 경쟁 제안. 평균 신뢰도: 8.2/10. 격차: 건강 경제학 데이터 없음, FDA 규제 문서 없음, 제한적인 농촌 스크리닝 데이터.
Phase 2: 계획
에이전트 2가 RFA 검토 기준을 섹션에 매핑합니다. 메모리가 검색: L-008 "NIH 검토자가 혁신 과장을 처벌합니다." L-009 "'Despite advances in...' 시작은 클리셰입니다."
Phase 3: 라운드 1
에이전트 3: CR-002 [높음]: "Despite advances in..." 사용 — L-009에 따른 클리셰. CR-004 [보통]: "최초 전향적" 주장 검증 필요.
에이전트 4: O-001 [딜킬러]: "IDx-DR와 어떻게 다른가요?" 답변: 약함.
Phase 3: 라운드 2
토론 2: IDx-DR 차별화: "$15K 카메라 + 훈련된 사진작가 vs $3K 카메라 + 30분 훈련."
편향 감사: 확증 편향 보통(pro-AI 논문만 인용). 수정: 비판 논문 2편 추가.
Phase 3: 라운드 3 + Phase 4: 평가
에이전트 5가 Specific Aims(1페이지), Significance(1.5페이지), Innovation(1.5페이지)를 생산합니다. 전체: 85/100, 높은 신뢰도. 학습: L-008: "최초" 주장 검증. L-009: 데이터 기반 시작문 사용. L-010: Aims에 커뮤니티 참여.
Read Once Query Forever v2: 200편 논문을 쿼리 가능한 지식 시스템으로 변환
라운드 테이블은 산출물을 구축합니다. Read Once Query Forever v2는 그것들이 그라운딩되는 증거 기반을 구축합니다. 논문 컬렉션을 한 번 업로드하세요. 시스템이 모든 논문을 수집하고, 지식 그래프를 구축하고, 모순과 격차를 감지하고, 인용과 함께 영구적으로 질문에 답변합니다.
동일한 PPAE 프레임워크. 다른 에이전트. 다른 출력. 함께 작동합니다: RAGQF를 사용하여 증거 기반을 구축한 다음 소스 레지스트리로 라운드 테이블에 공급하세요.
멀티 AI 컬렉션에 포함된 것
“편향 감사가 NIH R01에서 6개월 동안의 초안에서 놓쳤던 프레이밍 오류 3개를 잡았습니다. 프로그램 책임자가 이번 사이클에서 검토한 가장 강력한 Specific Aims라고 말했습니다.”
“Read Once Query Forever가 문헌 리뷰를 구했습니다. 논문 200편이 있었습니다. 지식 그래프가 완전히 놓쳤던 모순 3개와 커버리지의 주요 격차 2개를 보여주었습니다.”
“v1은 이사회 토론이었습니다. v2는 완전한 운영 체제입니다. 메모리 시스템 덕분에 매 세션마다 비즈니스를 재설명할 필요가 없습니다. 검증 게이트 덕분에 출력을 신뢰할 수 있습니다.”