97.
Emulation von Siri unter W7
Einleitung
Siri
von Apple ist zur Zeit in aller Munde, verzeihung Ohren. Der
Sternenhimmelstuermer beschäftigte sich bereits vor 40 Abhandlungen
zuvor mit Sprachausgabe durch eine Batch und Voicebenachrichtigung -
die Batch hieß leider nicht Siri :-). Würde die Microsoft Corporation
nicht Trends verschlafen, dann wäre denen aufgefallen, dass Windows 7
durch die integrierte Sprachausgabe die besten Voraussetzungen hat, um
Siri in den Schatten zu stellen...Aber Microsoft war scheinbar so mit
dem Abkupfern der Touchtechnologie für Windows 8 beschäftigt,
dass
die Marketingstrategie und Weiterentwicklung des Windowsphone 7 auf der
Strecke blieb. Dabei waren die Aufgaben, die Siri erledigt, schon
weitaus früher im Phone 7 implementiert.
Siri
ist auch nicht von Apple erfunden, sondern war die
Übernahme einer dieser kleinen innovativen Firmen, die aufgekauft
wurden - in diesem Fall die Siri Innc.
Nicht einmal der Name "Siri" ist eine eigene Erfindung...Vermarktung
ist alles! "Null Entwicklungskosten", der Name bereits patentiert, da
kann man wahrlich von den Applejüngern einen stolzen Preis für Siri
verlangen :-)
Nein, der Sternenhimmelstuermer ist ein
wenig frustiert, dass er sich nicht für ein I-Phone entschied, dass nun
mit freundlicher Stimme sämtliche private Daten entlockt und sämtliche
Daten an Apple wider jeglicher Form von Datenschutz postet. Lassen Sie
dann Siri nur Ihre Potenzmittel im Internet suchen oder geben Siri
einen Auftragsmord auf? ... ach ja, so weit wie in "Staatsfeind Nummer
1" ist die Technologie noch nicht (aber dicht dran..), aber immerhin
könnten Sie sich einen Anwalt besorgen, wenn Sie einen Mord
eigenständig begingen...
Kleiner Tip an Apple: Ihr habt genug
Jünger, schafft doch den Ablasshandel wieder ein - Absolution per Siri,
ist eine uralte katholische Geschäftsidee in Europa mit hoher
Gewinnspanne...
Inhaltsangabe
Sprachausgabe a la Microsoft Corporation
Für Sehbehinderte und technikbegeisterte NVDA
eSpeak - Teil von NVDA und Standallone mit Kommandozeilenbefehlen
Fazit
Sprachausgabe a la Microsoft Corporation
"Im Lieferumfang von Windows
ist ein einfaches Bildschirmleseprogramm mit Namen Sprachausgabe
enthalten, das Text auf dem Bildschirm vorliest und einige Ereignisse
beschreibt, die während der Verwendung des Computers auftreten (z. B.
das Anzeigen einer Fehlermeldung)." Quelle.
Nun ja, pragmatisch wird dann
noch die Ausführung beschrieben: Alle Programme - Zubehör -
erleichterte Bedienung
Da liegen dann
zwei Programme:
Die Sprachausgabe (Pfad: "C:\Windows\system32\Narrator.exe")
und
die Windows-Spracherkennung ("C:\Windows\Speech\Common\sapisvr.exe")
Wenn
Sie die Spracherkennung starten, wird der Einrichtungsassistent
gestartet:
Im
Begrüßungsfenster steht dann schon der Sinn - Zitat: "Die
Spracherkennung ermöglicht die Steuerung des Computers per
Spracheingabe".
"Sie
haben die
Möglichkeit allein per Spracheingabe Programme zu starten, Menüs zu
öffnen, auf Schaltflächen oder andere Bildschirmobjekte zu klicken,
Text in Dokumente zu diktieren sowie E_Mails zu schreiben und zu
versenden. Nahezu alle Aktionen, die mittels Tastatur und Maus
ausgeführt werden, lassen sich auch per Spracheingabe ausführen...."
Die
Windowssprachausgabe kann: Tastatureingabe
des Benutzers wiederholen, Systemmeldungen ankündigen,
Bildlaufbenachrichtigungen
ankündigen, Sprachausgabe minimiert starten...
Für Sehbehinderte und technikbegeisterte NVDA
NVDA
ist ein Freeware und Opensource-Projekt zur Sprachausgabe von
Bildschirmtexten (objektorientiert). Den Download einer portablen
Version zum ausprobieren finden Sie hier
beim Originalhersteller. Keine Sorge, nach dem Sie den Downloadfile
angeklickt haben, werden Sie zu einer freiwilligen Geldspende
aufgerufen. Diese Aufforderung negieren Sie mit dem Link links unten: "I do not wish to support the project at this time, continue to download"
und der Download beginnt. Der Sternenhimmelstuermer gibt keinen
direkten Downloadlink, da vielleicht ja jemand das Projekt unterstützen
will und das keine schlechte Sache ist.
Denken Sie daran - Siri hatte auch seinen Ursprung bei einer kleinen innovativen Firma...
Danach können Sie den 13
MB großen File herunterladen. Ist ein selbstentpackendes Archiv mit der
Endung Exe.
Das Tool baut sich in der portablen Version nicht in die Registry ein. Nachdem Sie die schmucklose NVDA.exe im Ordner NVDA
doppelklicken, baut sich in die Taskleiste ein Icon ein.
Mit
rechter
Maustaste können Sie im Eigenschaftsmenü des Icons sämtliche
Einstellungen in deutscher Kommandobefehlsumgebung vornehmen
(verschiedene
Stimmen, Tonlage...). Das Programm läuft schon in deutscher Sprache.
Überall, wo Sie mit den Cursor raufgehen, kommt dann eine Beschreibung.
Ruhige Bewegungen sind anzuraten, weil sich sonst die Stimme
überschlägt.
Im Unterordner Documentation - de ist eine deutsche
Bedienungsanleitung - die erklärt alles ziemlich präzise. Erwarten Sie
nicht zu viel. Die objektorientierte Lesefunktion ist präzise, aber die
Stimme ist gewöhnungsbedürftig und überschlägt sich manchmal.
In
Hinblick auf Windows 8 und Touchscreen gar nicht so schlecht und
innovativ.
Ein Teil dieser Software ist eSpeak - und eSpeak ist die Grundlage für cmd-basierte Sprachausgabe...
eSpeak - Teil von NVDA und Standallone mit Kommandozeilenbefehlen
NVDA hat eSpeak
als Sprachsynthesizer zur Grundlage. Das kann nicht nur als Front-End
benutzt werden, sondern ist auch ein Kommandozeilenprogramm.
Leider gibt es keine portable version und so weit der Sternehimmenlstuermer es ausprobierte auch nicht verschiebbar...
Na, jedenfalls können Sie im Pfad "C:\Program Files\eSpeak\command_line\espeak.exe"
Das Kommandozeilentool aktivieren. Daneben liegt ein
Textdokument, dass der Sternenhimmelstuermer mal sinngemäß vom Inhalt
ein wenig angepasst auf deutsche Verhältnisse wiedergibt:
Die Hilfe in der Kommandozeile erhalten Sie durch die Eingabe: espeak --help
Eine Stimme wählen Sie mit dem Befehl: espeak --voices aus
Sie können Text direkt ausgeben mit Text in Anführungszeichen: espeak -v de "hallo welt"
oder espeak -v de -f textfile.txt , wobei de für deutsch steht und en für Englisch....
Sie können Dateien mit eSpeak espeak als Wavedateien aufzeichnen: -w test.wav "hello" Vorsicht: Wave-Dateien werden schnell groß. Sie sollten bei längeren Texten die Wave-dateien in MP 3 Dateien konvertieren.
Die Sternenhimmelstuermerseite wird hierzu erstmal keine Batches schreiben - Sie können aber eine der Batches wie die KI-Batch
gerne anpassen:
cd C:\Program Files\eSpeak\command_line
set /p ran=Geben Sie den Namen eines Textdokumentes ein:
espeak -v de -f C:\versc\%ran%.txt
Das
sind so die Grundzeilen, um mit einer Variablen ein beliebiges Dokument
im Ordner Versuch zu öffnen, nachdem Sie den Namen des Textdokuments
eingegeben haben...
oder
cd C:\Program Files\eSpeak\command_line
set /p ran=Geben Sie einen beliebigen Text ein:
espeak -v de "%ran%"
um einen Text einfach frei nach Schnauze einzugeben...
Der Sternenhimmelstuermer steuert hier keine Batch zu,
da Sprache in dieser Form nicht wirklich ein Bestandteil von
künstlicher Intelligenz ist und damit das nur so eine Anregung für
Spielereien ist.
Fazit:
Außer
den hier vorgestellten Tools gibt es auch viele andere Tools zum Lesen
oder Vorlesen von Textdokumenten. Das hat jedoch - abgesehen von NVDA
nichts mit Siri und Co. zu tun.
Siri traf den Zeitgeist und
konnte dank jahrelanger Entwicklung und nun ausgereifter Technologie
umgesetzt werden. Apple verbesserte geschickt ein bestehendes Prokukt -
zugegeben aber viel einfacher, benutzerfreundlicher und intuitiver -
nachdem was man so hört...
Die Microsoft Corporation hat
scheinbar ein erhebliches Problem gute Ansätze weiterzuentwickeln und
zu vermarkten und dadurch Trends zu setzen. Siri wird es bald auch in
irgendeiner Form auf Android oder Windows Phone 7 verbessert geben,
aber fairerweise muss gesagt werden, dass der Microsoft Corporation der
Titel beste Grundlagenforschung verliehen werden muss. Und das was
schon auf dem Smartphone windows phone 7 vor Siri bestand kommt Siri bedenklich nahe... Allerdings besitzt Siri scheinbar mehr KI.
Der
Sternenhimmelstuermer glaubt auch, dass in den nächsten Windowsphone 7
Updates eine mindestens adäquate, wenn nicht bessere Form von Siri
kommt.
Wenn Siri also für Sie ein schlagendes Argument sein
sollte, werden Sie vermutlich mit einem Windows Phone 7 keinen Fehler
machen.