97. Emulation von Siri unter W7

Einleitung

Siri von Apple ist zur Zeit in aller Munde, verzeihung Ohren. Der Sternenhimmelstuermer beschäftigte sich bereits vor 40 Abhandlungen zuvor mit Sprachausgabe durch eine Batch und Voicebenachrichtigung - die Batch hieß leider nicht Siri :-). Würde die Microsoft Corporation nicht Trends verschlafen, dann wäre denen aufgefallen, dass Windows 7 durch die integrierte Sprachausgabe die besten Voraussetzungen hat, um Siri in den Schatten zu stellen...Aber Microsoft war scheinbar so mit dem Abkupfern der Touchtechnologie für Windows 8 beschäftigt, dass die Marketingstrategie und Weiterentwicklung des Windowsphone 7 auf der Strecke blieb. Dabei waren die Aufgaben, die Siri erledigt, schon weitaus früher im Phone 7 implementiert.

Siri ist auch nicht von Apple erfunden, sondern war die Übernahme einer dieser kleinen innovativen Firmen, die aufgekauft wurden - in diesem Fall die Siri Innc. Nicht einmal der Name "Siri" ist eine eigene Erfindung...Vermarktung ist alles! "Null Entwicklungskosten", der Name bereits patentiert, da kann man wahrlich von den Applejüngern einen stolzen Preis für Siri verlangen :-) 

Nein, der Sternenhimmelstuermer ist ein wenig frustiert, dass er sich nicht für ein I-Phone entschied, dass nun mit freundlicher Stimme sämtliche private Daten entlockt und sämtliche Daten an Apple wider jeglicher Form von Datenschutz postet. Lassen Sie dann Siri nur Ihre Potenzmittel im Internet suchen oder geben Siri einen Auftragsmord auf? ... ach ja, so weit wie in "Staatsfeind Nummer 1" ist die Technologie noch nicht (aber dicht dran..), aber immerhin könnten Sie sich einen Anwalt besorgen, wenn Sie einen Mord eigenständig begingen...

Kleiner Tip an Apple: Ihr habt genug Jünger, schafft doch den Ablasshandel wieder ein - Absolution per Siri, ist eine uralte katholische Geschäftsidee in Europa mit hoher Gewinnspanne...

Inhaltsangabe
Sprachausgabe a la Microsoft Corporation

Für Sehbehinderte und technikbegeisterte NVDA
eSpeak - Teil von NVDA und Standallone mit Kommandozeilenbefehlen
Fazit


Sprachausgabe a la Microsoft Corporation


"Im Lieferumfang von Windows ist ein einfaches Bildschirmleseprogramm mit Namen Sprachausgabe enthalten, das Text auf dem Bildschirm vorliest und einige Ereignisse beschreibt, die während der Verwendung des Computers auftreten (z. B. das Anzeigen einer Fehlermeldung)." Quelle.

Nun ja, pragmatisch wird dann noch die Ausführung beschrieben: Alle Programme - Zubehör - erleichterte Bedienung

Da liegen dann zwei Programme:

 Die Sprachausgabe (Pfad: "C:\Windows\system32\Narrator.exe")

und die Windows-Spracherkennung ("C:\Windows\Speech\Common\sapisvr.exe")

Wenn Sie die Spracherkennung starten, wird der Einrichtungsassistent gestartet:

Im Begrüßungsfenster steht dann schon der Sinn - Zitat: "Die Spracherkennung ermöglicht die Steuerung des Computers per Spracheingabe".

"Sie haben die Möglichkeit allein per Spracheingabe Programme zu starten, Menüs zu öffnen, auf Schaltflächen oder andere Bildschirmobjekte zu klicken, Text in Dokumente zu diktieren sowie E_Mails zu schreiben und zu versenden. Nahezu alle Aktionen, die mittels Tastatur und Maus ausgeführt werden, lassen sich auch per Spracheingabe ausführen...."


Die Windowssprachausgabe kann: Tastatureingabe des Benutzers wiederholen, Systemmeldungen ankündigen, Bildlaufbenachrichtigungen ankündigen, Sprachausgabe minimiert starten...


Für Sehbehinderte und technikbegeisterte NVDA

NVDA ist ein Freeware und Opensource-Projekt zur Sprachausgabe von Bildschirmtexten (objektorientiert). Den Download einer portablen Version zum ausprobieren finden Sie hier beim Originalhersteller. Keine Sorge, nach dem Sie den Downloadfile angeklickt haben, werden Sie zu einer freiwilligen Geldspende aufgerufen. Diese Aufforderung negieren Sie mit dem Link links unten: "I do not wish to support the project at this time, continue to download" und der Download beginnt. Der Sternenhimmelstuermer gibt keinen direkten Downloadlink, da vielleicht ja jemand das Projekt unterstützen will und das keine schlechte Sache ist.

Denken Sie daran - Siri hatte auch seinen Ursprung bei einer kleinen innovativen Firma...


Danach können Sie den 13 MB großen File herunterladen. Ist ein selbstentpackendes Archiv mit der Endung Exe.

Das Tool baut sich in der portablen Version nicht in die Registry ein. Nachdem Sie die schmucklose NVDA.exe im Ordner NVDA doppelklicken, baut sich in die Taskleiste ein Icon ein.
Mit rechter Maustaste können Sie im Eigenschaftsmenü des Icons sämtliche Einstellungen in deutscher Kommandobefehlsumgebung vornehmen (verschiedene Stimmen, Tonlage...). Das Programm läuft schon in deutscher Sprache. Überall, wo Sie mit den Cursor raufgehen, kommt dann eine Beschreibung. Ruhige Bewegungen sind anzuraten, weil sich sonst die Stimme überschlägt.

Im Unterordner Documentation - de ist eine deutsche Bedienungsanleitung - die erklärt alles ziemlich präzise. Erwarten Sie nicht zu viel. Die objektorientierte Lesefunktion ist präzise, aber die Stimme ist gewöhnungsbedürftig und überschlägt sich manchmal.

In Hinblick auf Windows 8 und Touchscreen gar nicht so schlecht und innovativ.

Ein Teil dieser Software ist eSpeak - und eSpeak ist die Grundlage für cmd-basierte Sprachausgabe...



eSpeak - Teil von NVDA und Standallone mit Kommandozeilenbefehlen

NVDA hat eSpeak als Sprachsynthesizer zur Grundlage. Das kann nicht nur als Front-End benutzt werden, sondern ist auch ein Kommandozeilenprogramm.
Leider gibt es keine portable version und so weit der Sternehimmenlstuermer es ausprobierte auch nicht verschiebbar...

Na, jedenfalls können Sie im Pfad "C:\Program Files\eSpeak\command_line\espeak.exe"  Das Kommandozeilentool aktivieren. Daneben liegt ein Textdokument, dass der Sternenhimmelstuermer mal sinngemäß vom Inhalt ein wenig angepasst auf deutsche Verhältnisse wiedergibt:

Die Hilfe in der Kommandozeile erhalten Sie durch die Eingabe:  espeak --help

Eine Stimme wählen Sie mit dem Befehl:  espeak --voices aus

Sie können Text direkt ausgeben mit Text in Anführungszeichen:  espeak -v de "hallo welt"
oder  espeak -v de -f textfile.txt , wobei de für deutsch steht und en für Englisch....

Sie können Dateien mit eSpeak espeak als Wavedateien aufzeichnen: -w test.wav "hello" Vorsicht: Wave-Dateien werden schnell groß. Sie sollten bei längeren Texten die Wave-dateien in MP 3 Dateien konvertieren.

Die Sternenhimmelstuermerseite wird hierzu erstmal keine Batches schreiben - Sie können aber eine der Batches wie die KI-Batch gerne anpassen:

cd C:\Program Files\eSpeak\command_line
set /p ran=Geben Sie den Namen eines Textdokumentes ein:
espeak -v de -f C:\versc\%ran%.txt

Das sind so die Grundzeilen, um mit einer Variablen ein beliebiges Dokument im Ordner Versuch zu öffnen, nachdem Sie den Namen des Textdokuments eingegeben haben...

oder

cd C:\Program Files\eSpeak\command_line
set /p ran=Geben Sie einen beliebigen Text ein:
espeak -v de "%ran%"

um einen Text einfach frei nach Schnauze einzugeben...

Der Sternenhimmelstuermer steuert hier keine Batch zu, da Sprache in dieser Form nicht wirklich ein Bestandteil von künstlicher Intelligenz ist und damit das nur so eine Anregung für Spielereien ist.


Fazit:

Außer den hier vorgestellten Tools gibt es auch viele andere Tools zum Lesen oder Vorlesen von Textdokumenten. Das hat jedoch - abgesehen von NVDA nichts mit Siri und Co. zu tun.

Siri traf den Zeitgeist und konnte dank jahrelanger Entwicklung und nun ausgereifter Technologie umgesetzt werden. Apple verbesserte geschickt ein bestehendes Prokukt - zugegeben aber viel einfacher, benutzerfreundlicher und intuitiver - nachdem was man so hört...

Die Microsoft Corporation hat scheinbar ein erhebliches Problem gute Ansätze weiterzuentwickeln und zu vermarkten und dadurch Trends zu setzen. Siri wird es bald auch in irgendeiner Form auf Android oder Windows Phone 7 verbessert geben, aber fairerweise muss gesagt werden, dass der Microsoft Corporation der Titel beste Grundlagenforschung verliehen werden muss. Und das was schon auf dem Smartphone windows phone 7 vor Siri bestand kommt Siri bedenklich nahe... Allerdings besitzt Siri scheinbar mehr KI.

Der Sternenhimmelstuermer glaubt auch, dass in den nächsten Windowsphone 7 Updates eine mindestens adäquate, wenn nicht bessere Form von Siri kommt.

Wenn Siri also für Sie ein schlagendes Argument sein sollte, werden Sie vermutlich mit einem Windows Phone 7 keinen Fehler machen.





Impressum
Datenschutz