MeetingMind — Gemini 회의 녹음 요약

Gemini API Key

Google AI Studio에서 발급된 API Key를 입력하세요.
키는 브라우저 localStorage에 저장됩니다.

00:00

중간 요약 0 회

다음 요약까지 5:00

STT 실시간 전사

녹음을 시작하면 텍스트가 표시됩니다.

AI 보정 텍스트

AI 보정 결과가 여기 표시됩니다.

중간 요약

대기중

5분 경과 시 자동 생성됩니다

메모 정리

녹음 종료 후 생성

00:00

화자 0 명

중간 요약 0 회

다음 요약 5:00

화자 분리 STT

녹음을 시작하면 대화가 표시됩니다

화자별 중간 요약

5분 경과 시 화자별 요약이 생성됩니다

전체 요약 + 화자별 최종

녹음 종료 후 생성

단독 녹음 파이프라인

Web Speech API

SpeechRecognition · ko-KR
interim → 즉시 표시 / final → 확정

브라우저

AI 맥락 보정

correctText() · call({ thinking:'low' })
STT 오인지 → 문맥 기반 교정

Gemini

5분 중간 요약

midSummary() · call({ thinking:'low' })
300s 주기 · 누적 텍스트 요약

주기

메모 최종 정리

finalSummary() · callJson({ thinking:'medium' })
title / summary / keyPoints / nextActions

출력

다자 회의 추가 단계

Web Speech API + VAD

SttRecorder · 발화 텍스트 수신
SpeakerDiarizer · 음량 임계값 발화 감지

브라우저

MFCC 화자 분리

Web Audio API · FFT → Mel filterbank
13차원 벡터 · 코사인 유사도 ≥ 0.82

즉시

Gemini 검증 (30초 주기)

callAudio() · MFCC 결과 vs Gemini 비교
일치율 < 80% → 화자 레이블 재매핑

Gemini

화자별 버퍼 누적 + 보정

SpeakerRegistry · 색상/방향 동적 배정
correctText() · 화자별 텍스트 보정

화자별 중간 요약

speakerMidSummary() · 5분 주기
화자별 병렬 요약

주기

전체 + 화자별 최종

speakerFinalSummary() · callJson({ thinking:'medium' })
overall / speakers / keyPoints / nextActions

출력

모듈 구성

stt.js Web Speech API 래퍼

speaker.js MFCC + Gemini 하이브리드 화자 분리

aiProcessor.js 보정 · 중간요약 · 최종요약

geminiClient.js call / callJson / callAudio 공통 클라이언트

최근 녹음 기록