요약 생성 중...
닫기
다시 저장
Gemini API Key
저장
Google AI Studio에서 발급된 API Key를 입력하세요.
키는 브라우저 localStorage에 저장됩니다.
ME
eting
S
ummary
A
ssistant
API Key 설정
00:00
녹음 시작
중간 요약
0 회
다음 요약까지
5:00
STT
실시간 전사
녹음을 시작하면 텍스트가 표시됩니다.
AI
보정 텍스트
AI 보정 결과가 여기 표시됩니다.
중간 요약
대기중
5분 경과 시 자동 생성됩니다
‹
›
메모 정리
녹음 종료 후 생성
탭하여 크게 보기 ↗
00:00
녹음 시작
화자
0 명
중간 요약
0 회
다음 요약
5:00
화자 분리 STT
녹음을 시작하면 대화가 표시됩니다
화자별 중간 요약
0~5분
5~10분
5분 경과 시 화자별 요약이 생성됩니다
전체 요약 + 화자별 최종
녹음 종료 후 생성
단독 녹음 파이프라인
1
Web Speech API
SpeechRecognition · ko-KR
interim → 즉시 표시 / final → 확정
브라우저
2
AI 맥락 보정
correctText() · call({ thinking:'low' })
STT 오인지 → 문맥 기반 교정
Gemini
3
5분 중간 요약
midSummary() · call({ thinking:'low' })
300s 주기 · 누적 텍스트 요약
주기
4
메모 최종 정리
finalSummary() · callJson({ thinking:'medium' })
title / summary / keyPoints / nextActions
출력
다자 회의 추가 단계
A
Web Speech API + VAD
SttRecorder · 발화 텍스트 수신
SpeakerDiarizer · 음량 임계값 발화 감지
브라우저
B
MFCC 화자 분리
Web Audio API · FFT → Mel filterbank
13차원 벡터 · 코사인 유사도 ≥ 0.82
즉시
C
Gemini 검증 (30초 주기)
callAudio() · MFCC 결과 vs Gemini 비교
일치율 < 80% → 화자 레이블 재매핑
Gemini
D
화자별 버퍼 누적 + 보정
SpeakerRegistry · 색상/방향 동적 배정
correctText() · 화자별 텍스트 보정
E
화자별 중간 요약
speakerMidSummary() · 5분 주기
화자별 병렬 요약
주기
F
전체 + 화자별 최종
speakerFinalSummary() · callJson({ thinking:'medium' })
overall / speakers / keyPoints / nextActions
출력
모듈 구성
stt.js
Web Speech API 래퍼
speaker.js
MFCC + Gemini 하이브리드 화자 분리
aiProcessor.js
보정 · 중간요약 · 최종요약
geminiClient.js
call / callJson / callAudio 공통 클라이언트
최근 녹음 기록
전체 삭제
요약
📋 복사
✎ 편집
✕