Apfeltube.de

Apple News und Gerüchte

Wie Siri funktioniert…

Achtung, lange Story!

Im Moment gibt eine Menge Skandale in der Siri-Port-Scene.
Ein Siri Port ist eine legale oder wahrscheinlich eher illegale Methode den Sprachassistenten Siri, der neu mit dem iPhone 4s vorgestellt wurde, auf einem Gerät zu benutzen, für das es nicht vorgesehen ist.

Dazu muss man wissen, dass Apple bei der Vorstellung von Siri behauptet hat, dass Siri nicht auf älteren Geräten laufe, da es nur mit einem A5 Prozessor funktioniere, welcher im Moment im iPad 2 und im iPhone 4s verbaut ist.
Daraufhin haben sich vor ca. 1,5 Monaten zwei erfahrene Software-Emtwickler zusammengetan um Siri zu ‚cracken‘. Erfolgreich.
Sie haben Siri auf einem iPhone 4 und einem iPod Touch 4 mit iOS 5 komplett zum Laufen gebracht.

Weiterhin haben sie berichtet, dass Siri also nicht nur mit A5-Geräten funktioniert, dafür aber sehr komplexe Vorgänge nötig seien, und vor Allem ein iPhone 4s mit Jailbreak.

Zu dem Zeitpunkt machte es also wenig Sinn zu versuchen Siri zu porten, da man dafür so oder so ein iPhone 4s brauchte.
Und wenn man ein 4s hat, braucht man kein 4 auf dem das Selbe, nur in langsamer läuft…

Etwas später, vor ca. einem Monat, hat eine französische Application-Entwicklungs Firma, namens Applidium(Link) etwas sehr interessantes herausgefunden.

Kompliziert, also aufpassen!:

    Legende:
    iPhone= iPhone 4s
    Server= guzzoni.apple.com
    Port=Kurzform von Portierung=Übertragung(z.B. Auf ein anderes Gerät)

Wenn Siri, also das iPhone eine Frage, z. B. "Wie spät ist es in New York?" beantworten soll, passieren viele kleine Schritte.

1. Das Mikrofon des iPhones nimmt die Frage des Benutzers auf, wandelt sie in digitale Audio-Wellen um und verschlüsstelt sie (später mehr)

2. Das iPhone sendet die verschlüsselten Audio-Dateien in kleinen Päckchen an einen Apple-Server.

3. Das iPhone erzeugt einen sogenannten 'X-Ace-Key', der sich auch in der Datenbank des Servers befindet. Damit meldet es sich beim Server an, dieser prüft, ober er den Key kennt.

3.1: Wenn er den Key nicht kennt, sagt das iPhone dem Benutzer "Ich kann leider nicht mit dem Server kommunizieren."

3.2: Wenn der Server den Key kennt, nimmt er die Sprachpakete auf, entschlüsselt sie und schickt sie durch eine riesige Datenbank von Audio-Fetzen.

Das muss man sich folgendermaßen vorstellen:

    Jemand hat ein Puzzle entworfen, bei dem jedes Teil ein Buchstabe, ein Silbe, oder ein anderer Ausdruck in Form von Text daraufstehen hat. Zu jedem dieser Teile hat er ein bisschen Audio aufgenommen. Beispielsweise für die Silbe „Hal“ hat er aufgenommen, wie er „Hallo“ sagt und dann nur den ersten Teil genommen und gespeichert. Dann ist er zu seinem Vater gegangen und hat das Selbe mit ihm gemacht, dann mit seiner Mutter, Großmutter, Großvater, Kinder, Onkel, Tanten, Bekannte, Freunde, Partner aus dem Internet…
    Diese hat er alle für das eine Teil gespeichert. Und dann hat er das Selbe noch einmal mit der Silbe „lo“ gemacht.
    Wenn jetzt jemand ankommt und eine Sounddatei hat, in der jemand „Hallo“ sagt, kann er das durch seine Datenbank schicken und diese es scannen lassen, ob es mit irgendeiner Datei übereinstimmt. Er wird also rausfinden, dass die Audiodatei aus „Hal“ und „lo“ besteht.
    Also gibt die Datenbank einen TEXT aus der "Hallo" sagt.

Das Selbe passiert auch bei dem Server. Nur dass dieser mehr als eine Sprache und auch mehr als zehn Stimmen kennt.
Er erkennt also die Sounddateien und wandelt sie in Text um. Jetzt gibt es noch eine Datenbank, die erkennt, was der Text heißt.
Da haben sich sehr viele Entwickler hingesetzt und Verbindungen zwischen Text und Befehlen zu programmieren.
Diese Datenbank bekommt also „Hallo“ als Text rein und durch die Verknüpfungen findet es heraus, dass „Hallo!“ eine Begrüßung ist und man darauf mit einem Rückgrüß antwortet.
Der Server sendet also einen Text zurück, der sagt: „Auch Hallo!“ und dann auf dem Bildschirm des iPhones angezeigt wird.

Soweit erstmal. Lassen wir das mal sacken.

Advertisements

Eine Antwort zu “Wie Siri funktioniert…

  1. Pingback: SiriProxy Einführung | ApfelTube.de

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: