Einstieg

Eine Einrichtungsvorlage mit den Installationsanweisungen und der vollständigen Markdown-Guideline für diesen Plugin kopieren.

        Set up this Capacitor plugin in the project.

Use the package manager already used by the project.
Install these package(s): `@capgo/capacitor-speech-recognition`
Run the required Capacitor sync/update step after installation.
Read this markdown guide for the full setup steps: https://raw.githubusercontent.com/Cap-go/website/refs/heads/main/apps/docs/src/content/docs/docs/plugins/speech-recognition/getting-started.mdx
Use that guide for platform-specific steps, native file edits, permissions, config changes, imports, and usage setup.
If that guide references other docs pages, read them too.

Installieren

bun add @capgo/capacitor-speech-recognition
bunx cap sync

Importieren

import { SpeechRecognition } from '@capgo/capacitor-speech-recognition';

API Übersicht

`available`

Überprüft, ob die native Spracherkennungsdienstleistung auf dem aktuellen Gerät verfügbar ist.

import { SpeechRecognition } from '@capgo/capacitor-speech-recognition';

await SpeechRecognition.available();

`isOnDeviceRecognitionAvailable`

Überprüft, ob die Plattform die neueren auf-Geräte-Erkennungspfade für die ausgewählte Region verfügbar macht.

Dies ist die Fähigkeitsprüfung, die Sie vor der Aktivierung verwenden sollten. useOnDeviceRecognition. A true Ein Ergebnis bedeutet, dass das aktuelle Gerät, die Betriebssystemversion und die Region die neueren auf-Geräte-Pfade für diese Plattform verwenden können.

Rückgabewert false Wenn das Gerät nur den Legacy-Recognizer-Path unterstützt.

Plattform SDK Dokumentation: iOS: Sprache Spracherkennung

import { SpeechRecognition } from '@capgo/capacitor-speech-recognition';

await SpeechRecognition.isOnDeviceRecognitionAvailable();

`start`

Beginnt mit der Aufnahmeeinstellung und transkribiert den Gesprächsverlauf.

Wenn partialResults ist true, löst sich die zurückgegebene Promise sofort auf und die Updates werden bis zum Ende der Sitzung über den partialResults Hörer gestreamt.

Der Standardpfad hält die Legacy-Erkennungsbahavior für die Rückwärtskompatibilität aufrecht. Pass useOnDeviceRecognition: true nur nachdem man überprüft hat .

import { SpeechRecognition } from '@capgo/capacitor-speech-recognition';

await SpeechRecognition.start();

`stop`

Stoppet die Verbindung und zerlegt native Ressourcen.

import { SpeechRecognition } from '@capgo/capacitor-speech-recognition';

await SpeechRecognition.stop();

`forceStop`

Beendet die aktuelle Sitzung.

Auf Android wird zuerst ein normaler Stopp versucht und dann fällt man auf destroy/recreate zurück. timeoutAuf iOS wird die aktuelle Sitzung sofort beendet.

Wenn ein Teiltranskript im Cache gespeichert ist, wird es über den partialResults Hörer mit forced: true.

import { SpeechRecognition } from '@capgo/capacitor-speech-recognition';

await SpeechRecognition.forceStop();

`getLastPartialResult`

Ermittelt das letzte im Cache gespeicherte Teiltranskript.

import { SpeechRecognition } from '@capgo/capacitor-speech-recognition';

await SpeechRecognition.getLastPartialResult();

`setPTTState`

Aktualisiert den aktuellen Zustand der Sprechtaste.

Verwenden Sie dies zusammen mit continuousPTT oder mit einer benutzerdefinierten Halte-zu-reden-Fluss.

import { SpeechRecognition } from '@capgo/capacitor-speech-recognition';

await SpeechRecognition.setPTTState({} as PTTStateOptions);

`getSupportedLanguages`

Ermittelt die von der zugrunde liegenden Erkennung unterstützten Sprachen.

Android-Geräte ab Version 13 offenbaren diese Liste nicht mehr; in diesem Fall ist sie leer. languages Zur Zwischenablage kopieren

import { SpeechRecognition } from '@capgo/capacitor-speech-recognition';

await SpeechRecognition.getSupportedLanguages();

`isListening`

Abschnitt mit dem Titel “isListening”

import { SpeechRecognition } from '@capgo/capacitor-speech-recognition';

await SpeechRecognition.isListening();

`checkPermissions`

Ermittelt den aktuellen Zustand der Berechtigungen.

import { SpeechRecognition } from '@capgo/capacitor-speech-recognition';

await SpeechRecognition.checkPermissions();

`requestPermissions`

Berechtigungen für die Mikrofon- und Spracherkennung anfordern.

import { SpeechRecognition } from '@capgo/capacitor-speech-recognition';

await SpeechRecognition.requestPermissions();

Typenverweis

`SpeechRecognitionAvailability`

export interface SpeechRecognitionAvailability {
  available: boolean;
}

`SpeechRecognitionStartOptions`

Konfigurieren Sie, wie der Recognizer verhält, wenn er aufgerufen wird.

export interface SpeechRecognitionStartOptions {
  /**
   * Locale identifier such as `en-US`. When omitted the device language is used.
   */
  language?: string;
  /**
   * Maximum number of final matches returned by native APIs. Defaults to `5`.
   */
  maxResults?: number;
  /**
   * Prompt message shown inside the Android system dialog (ignored on iOS).
   */
  prompt?: string;
  /**
   * When `true`, Android shows the OS speech dialog instead of running inline recognition.
   * Defaults to `false`.
   */
  popup?: boolean;
  /**
   * Emits partial transcription updates through the `partialResults` listener while audio is captured.
   */
  partialResults?: boolean;
  /**
   * Enables native punctuation handling where supported (iOS 16+).
   */
  addPunctuation?: boolean;
  /**
   * Opt in to the platform's newer on-device recognition path when available.
   *
   * On iOS 26+, this uses Apple's `SpeechAnalyzer` / `SpeechTranscriber` pipeline.
   * On recent Android versions, this uses the on-device `SpeechRecognizer` path.
   *
   * It is intentionally opt-in so existing apps keep the legacy flow unless they choose
   * to roll out the new behavior.
   *
   * Use {@link SpeechRecognitionPlugin.isOnDeviceRecognitionAvailable} before enabling it in production.
   *
   * Platform SDK docs:
   * iOS: [Speech](https://developer.apple.com/documentation/speech),
   * [SpeechAnalyzer](https://developer.apple.com/documentation/speech/speechanalyzer),
   * [SpeechTranscriber](https://developer.apple.com/documentation/speech/speechtranscriber)
   * Android: [SpeechRecognizer](https://developer.android.com/reference/android/speech/SpeechRecognizer)
   *
   * Defaults to `false`.
   */
  useOnDeviceRecognition?: boolean;
  /**
   * Allow a number of milliseconds of silence before splitting the recognition session into segments.
   * Required to be greater than zero and currently supported on Android only.
   */
  allowForSilence?: number;
  /**
   * EXPERIMENTAL: Keep a PTT session alive across silence by restarting recognition while the button stays held.
   *
   * This restart behavior is implemented for Android inline recognition and iOS native recognition.
   */
  continuousPTT?: boolean;
}

`SpeechRecognitionMatches`

export interface SpeechRecognitionMatches {
  matches?: string[];
}

`ForceStopOptions`

Optionen für .

export interface ForceStopOptions {
  /**
   * Android only: timeout in milliseconds before forcing stop via destroy/recreate.
   *
   * On iOS, the current session is stopped immediately and this value is ignored.
   *
   * Defaults to `1500`.
   */
  timeout?: number;
}

`LastPartialResult`

Ergbnis von .

export interface LastPartialResult {
  /**
   * Whether a partial result is currently cached.
   */
  available: boolean;
  /**
   * The most recent transcript text known to the native recognizer.
   */
  text: string;
  /**
   * All current match alternatives when available.
   */
  matches?: string[];
}

`PTTStateOptions`

Optionen für .

export interface PTTStateOptions {
  /**
   * Whether the PTT button is currently held.
   */
  held: boolean;
}

`SpeechRecognitionLanguages`

export interface SpeechRecognitionLanguages {
  languages: string[];
}

`SpeechRecognitionListening`

export interface SpeechRecognitionListening {
  listening: boolean;
}

`SpeechRecognitionPermissionStatus`

Zugriffsmappe, die von checkPermissions und requestPermissions.

export interface SpeechRecognitionPermissionStatus {
  speechRecognition: PermissionState;
}

`SpeechRecognitionSegmentResultEvent`

Ausgelöst, wenn ein segmentiertes Ergebnis erzeugt wird (nur Android).

export interface SpeechRecognitionSegmentResultEvent {
  matches: string[];
}

`SpeechRecognitionPartialResultEvent`

Wird ausgelöst, wenn eine teilweise Transkription erstellt wird.

export interface SpeechRecognitionPartialResultEvent {
  /**
   * Current recognition matches when the native recognizer reports them.
   *
   * This can be omitted for forced or accumulated-only payloads.
   */
  matches?: string[];
  /**
   * Accumulated transcription from earlier continuous PTT cycles.
   */
  accumulated?: string;
  /**
   * Final accumulated text including the current result.
   */
  accumulatedText?: string;
  /**
   * `true` when the plugin is restarting recognition inside a continuous PTT session.
   */
  isRestarting?: boolean;
  /**
   * `true` when the payload was emitted by `forceStop()`.
   */
  forced?: boolean;
}

`SpeechRecognitionListeningEvent`

Wird ausgelöst, wenn der Hörzustand sich ändert.

export interface SpeechRecognitionListeningEvent {
  /**
   * Finite state of the recognition session.
   */
  state?: ListeningFiniteState;
  /**
   * Unique identifier for the current listening session.
   */
  sessionId?: number;
  /**
   * Why this state transition occurred.
   */
  reason?: ListeningReason;
  /**
   * Error code when the transition is caused by an error.
   */
  errorCode?: string;
  /**
   * Backward-compatible binary state used by earlier releases.
   */
  status?: 'started' | 'stopped';
}

Quelle der Wahrheit

Diese Seite wird aus dem Plugin generiert. src/definitions.tsRe-run die Synchronisation, wenn die öffentliche API sich im Quellcode ändert.

Weitermachen von Getting Started

Wenn Sie verwenden Einstieg um das Dashboard und API-Operationen zu planen, verbinden Sie es mit Verwendung von @capgo/capacitor-Sprachverarbeitung für die native Fähigkeit in Verwendung von @capgo/capacitor-Sprachverarbeitung, API-Übersicht für die Implementierungsdetails in API-Übersicht, Einführung für die Implementierungsdetails in Einführung, API-Schlüssel für die Implementierungsdetails in API-Schlüssel, und Geräte für die Implementierungsdetails in Geräten.