Bundespatentgericht, Urteil vom 26.05.2021, Az. 4 Ni 3/21 (EP)

4. Senat | REWIS RS 2021, 5529

Tags hinzufügen

Sie können dem Inhalt selbst Schlagworten zuordnen. Geben Sie hierfür jeweils ein Schlagwort ein und drücken danach auf sichern, bevor Sie ggf. ein neues Schlagwort eingeben.

Beispiele: "Befangenheit", "Revision", "Ablehnung eines Richters"

QR-Code

Gegenstand

Patentnichtigkeitsklageverfahren – "Spracherkennungsvorrichtung, Anzeigeverfahren und Anzeigeverarbeitungsprogramm dazu (europäisches Patent)" – zur Frage der unzulässigen Erweiterung und der Patentfähigkeit


Tenor

In der [X.]

betreffend das europäische Patent 2 447 941

([X.] 2006 048 398)

hat der 4. Senat (Nichtigkeitssenat) des [X.] auf Grund der mündlichen Verhandlung vom 26. Mai 2021 durch die Vorsitzende Richterin [X.] und [X.]. Univ. [X.]. [X.], [X.], Dr. Söchtig und Dipl.-Phys. Univ. Dr. Haupt

für Recht erkannt:

[X.] Die Klage wird abgewiesen.

I[X.] Die Klägerin hat die Kosten des Rechtsstreits zu tragen.

II[X.] [X.] ist im Kostenpunkt gegen Sicherheitsleistung in Höhe von 120 % des jeweils zu vollstreckenden Betrages vorläufig vollstreckbar.

Tatbestand

1

Die Beklagte ist eingetragene Inhaberin des u. a. für die [X.] erteilten [X.] Patents 2 447 941, das am 1. Dezember 2006 unter Inanspruchnahme der Priorität der [X.] Patentanmeldung 2006001845 vom 6. Januar 2006 angemeldet und dessen Erteilung am 23. März 2016 veröffentlicht worden ist. Im [X.] des [X.] wird das Streitpatent, das die Bezeichnung „Speech recognition apparatus, display method and display processing program thereof“ („Spracherkennungsvorrichtung, Anzeigeverfahren und [X.] dazu“)“ trägt, unter dem Aktenzeichen 60 2006 048 398 geführt.

2

Das Streitpatent, das von der Klägerin in der [X.] im Umfang seiner Ansprüche 1, 3 und 4 und zuletzt mit Schriftsatz vom 29. Januar 2021 in vollem Umfang angegriffen wird, umfasst in seiner erteilten Fassung 4 Ansprüche mit dem unabhängigen Vorrichtungsanspruch 1, dem auf diesen rückbezogenen [X.], dem Verfahrensanspruch 3 und dem auf diesen rückbezogenen, auf ein Programm gerichteten Anspruch 4.

3

Die Klägerin macht geltend und begründet dies, der Gegenstand des Streitpatents sei unzulässig erweitert und nicht patentfähig, nämlich weder neu noch erfinderisch.

4

Die Beklagte verteidigt das Streitpatent in der erteilten Fassung sowie mit dem Hilfsantrag isoliert den Anspruch 2.

5

Der nach Merkmalen gegliederte Anspruch 1 lautet in der [X.] bzw. in einer angepassten Übersetzung in die [X.] Sprache:

6

1 A speech recognition apparatus, comprising:

7

Spracherkennungsvorrichtung, die Folgendes umfasst:

8

1.1 recognition unit (114) for carrying out a speech recognition process of recognizing the speech of the user,

9

eine [X.] (114) zum Ausführen eines [X.]es des Erkennens der Sprache des Nutzers,

1.1.2 instruction means for receiving speech recognition start instructions from a user, and instructing the recognition unit (114) to start the speech recognition process,

ein [X.] zum Empfangen von [X.]en von einem Nutzer und zum Anweisen der [X.] (114), den [X.] zu beginnen,

1.1.3 display means (110) for displaying at least one of recognizable speeches of the recognition unit (114),

ein Anzeigemittel (110) zum Anzeigen mindestens eines von erkennbaren Sprachtexten der [X.] (114),

1.1.4 and a sound processing unit (107),

und eine [X.] (107),

1.2 wherein the speech recognition apparatus further comprises control means (112),

wobei die Spracherkennungsvorrichtung des Weiteren ein [X.] (112) umfasst,

1.3 wherein a [X.] is necessary from a time when the recognition unit (114) receives instructions of start of the speech recognition process from the instruction means to a time when the recognition unit (114) is ready to carry out the speech recognition process,

wobei ein Einstellzeitraum ab einer Zeit, zu der die [X.] (114) Anweisungen zum Beginnen des [X.]es von dem [X.] empfängt, bis zu einer Zeit, wo die [X.] (114) zum Ausführen des [X.]es bereit ist, notwendig ist,

1.3.1 wherein the speech recognition process is started after the set-up operation has been completed, and

wobei der [X.] begonnen wird, nachdem der Einstellvorgang vollendet wurde, und

1.4 wherein the control means (112), is adapted

wobei das [X.] (112) dafür eingerichtet ist,

1.4.1 to control the display means (110)

das Anzeigemittel (110) zu veranlassen,

1.4.1a to start the display of a prohibition mark (3) indicative of prohibition of speech

das Anzeigen eines [X.] (3) zu beginnen, welches das Verbot eines Sprachtextes anzeigt,

1.4.1b and the display of the at least one of recognizable speeches

und das Anzeigen des mindestens einen von erkennbaren Sprachtexten

1.4.1c and the display of a guidance message (4),

und das Anzeigen einer [X.] (4) zu beginnen,

1.4.2 and to control the sound processing unit (107) to output the same content as the guidance message (4) as sound during the [X.],

und die [X.] (107) zu veranlassen, den gleichen Inhalt wie die [X.] (4) während des [X.] als Ton auszugeben,

1.4.3 wherein the prohibition mark (3) is erased from the display means (110) after the speech recognition process has started.

wobei das Verbotszeichen (3) von dem Anzeigemittel (110) gelöscht wird, nachdem der [X.] gestartet wurde.

Wegen des Wortlauts des Ansprüche 2 bis 4 wird auf die Streitpatentschrift verwiesen.

Im Hinblick auf die geltend gemachte fehlende Patentfähigkeit stützt sich die Klägerin insbesondere auf folgende Dokumente

[X.] [X.] 6,505,159 B1

[X.] [X.] 5,864,815 A

[X.] [X.] 2003/0095212 [X.]

sowie auf den in der mündlichen Verhandlung vom 26. Mai 2021 eingereichten Auszug des Benutzerhandbuchs

[X.] Dragon NaturallySpeaking 8, [X.], [X.], February 2005. Seiten [X.], 1-24 und 209 bis 215

und meint, das Streitpatent sei schon nicht neu gegenüber der Druckschrift [X.], jedenfalls beruhe es ausgehend vom Stand der Technik nach jeder der Schriften [X.], [X.] oder [X.] nicht auf einer erfinderischen Tätigkeit.

Die Klägerin ist der Auffassung, dass die [X.] alle Merkmale der unabhängigen Ansprüche des Streitpatents offenbare. Die [X.] lehre, dass zuerst, nämlich im Schritt 104, das „Activation Signal“ an den Computer 12 gesendet werde. Anschließend werde in Schritt 106 das „Computer Waiting Signal“ gesendet. Hieraus folge, dass sich der Einstellungszeitraum vom Schritt 104 bis zum Schritt 14 des [X.] der Figur 4 erstrecke, so dass das „Computer Waiting Signal“ innerhalb des [X.] gesendet werde. Die Anzeige des „[X.]“ als ein Icon stelle wiederum die Anzeige eines [X.] dar. Die [X.] offenbare darüber hinaus, dass das „Computer Waiting Signal" dem Nutzer auch graphisch als Text auf dem Bildschirm angezeigt werden könne, und dass als „Computer Waiting Signal" zusätzlich oder alternativ auch Symbole verwendet werden könnten, die auf dem Bildschirm angezeigt werden könnten. Ferner offenbare die [X.] auch das Merkmal, dass während des [X.] ein Satz zulässiger Sprachbefehle bereitgestellt werde. Dass der Satz der zulässigen Sprachbefehle dem Nutzer auch auf dem Bildschirm angezeigt werde, entnehme der Fachmann jedenfalls der [X.], Zeile 30 ff. der [X.], wonach sämtliche Signale zusätzlich oder alternativ auch auf dem Bildschirm der Eingabevorrichtung angezeigt werden könnten. Damit sei der Gegenstand der unabhängigen Ansprüche des Streitpatents nicht neu.

Selbst wenn man die Neuheitsschädlichkeit der [X.] verneinen wollte, würde es dem Streitpatent zumindest aber an der erfinderischen Tätigkeit fehlen, denn die Lehre des Streitpatents sei ausgehend von der [X.] jedenfalls nahegelegt. Die [X.] unterscheide sich vom Anspruch 1 des Streitpatents allenfalls an zwei Stellen: (1) Das „[X.]" werde zwar als hörbarer Ton und Audionachrichtensignal „Bitte warten" ausgegeben, es werde aber nicht explizit beschrieben, dass das „[X.]", auch über den von der [X.] offenbarten Bildschirm ausgegeben werde, also etwa durch eine Anzeige von „Bitte warten" auf dem Bildschirm, sowie (2), es werde zwar ein Satz zulässiger Sprachbefehle bereitgestellt, die [X.] beschreibe aber nicht ausdrücklich, dass dieser auch dem Benutzer über den von der [X.] offenbarten Bildschirm angezeigt würde.

Das Unterscheidungsmerkmal 1 betreffe lediglich den Inhalt der über den Bildschirm wiedergegebenen Informationen. Gemäß der ständigen Rechtsprechung des [X.] seien bei der Prüfung der erfinderischen Tätigkeit jedoch nur diejenigen Anweisungen zu berücksichtigen, die die Lösung des technischen Problems mit technischen Mitteln bestimmten oder zumindest beeinflussten, was bei der bloßen Wiedergabe von Informationen – wie vorliegend – hingegen nicht der Fall sei. Daher könne das Unterscheidungsmerkmal 1 nach der Rechtsprechung des [X.] gerade keine erfinderische Tätigkeit begründen, allenfalls sei Unterscheidungsmerkmal 2 bei der Beurteilung der erfinderischen Tätigkeit zu berücksichtigen. Die Anzeige zumindest eines der erkennbaren Sprachbefehle auf dem Display erlaube es dem Benutzer zu erkennen, welche Sprachbefehle er verwenden könne. Die Aufgabe sei daher, wie dem Benutzer vermittelt werden könne, welche Sprachbefehle er verwenden könne. Ausgehend von der [X.] werde der Fachmann dabei auf die [X.] stoßen.

Gegenstand der [X.] seien Computersysteme und Spracherkennung in Computersystemen. Insbesondere lehre die [X.], dass eine Liste erlaubter Sprachbefehle auf den Sprachbefehl „Was kann ich sagen" hin angezeigt werde. In der Figur 12 der [X.] werde eine beispielhafte Liste der Sprachbefehle gezeigt. Ausgehend von der [X.] habe der Fachmann also eine klare Veranlassung, die [X.] zur Lösung heranzuziehen. Denn die [X.] betreffe insbesondere die Situation, in der der Benutzer sich frage, welche Sprachbefehle er sagen könne. In gerade dieser Situation biete die [X.] eine praktische Lösung, die der Fachmann mit fachüblichen Mitteln in der Vorrichtung der [X.] zu implementieren verstehe.

Auch der Umstand, dass das Streitpatent lehre, dass während des [X.] sowohl ein Verbotszeichen, als auch mindestens eines von erkennungsfähigen (Sprach-)Wörtern angezeigt würden, vermöge eine erfinderische Tätigkeit nicht zu begründen. Hierbei handele es sich nicht um eine besondere unübliche, weil in gewisser Weise widersprüchliche, Darstellung – vielmehr sollte diese gemeinsame Darstellung es dem Benutzer lediglich ermöglichen, sich bereits während des [X.] auf die nachfolgende Spracheingabe vorzubereiten, was nachfolgende Verzögerungen vermeiden würde. Entsprechende vergleichbare Darstellungen seien bereits vor dem Prioritätszeitpunkt des Streitpatents üblich gewesen, was beispielsweise die [X.] (Seite 21 unten) belege.

Dem Streitpatent fehle es zudem an einer erfinderischen Tätigkeit ausgehend von der [X.]. Der Gegenstand des Anspruchs 1 des Streitpatents unterscheide sich von der Lehre der [X.] lediglich dadurch, dass (1) das Computersystem der [X.] nicht explizit eine [X.] zur Ausgabe des gleichen Inhalts wie der [X.] aufweise sowie (2) der Nutzer zwar grafisch durch ein Symbol und eine [X.] in Textform über den Zustand des Computersystems informiert werde, jedoch letztere Information nicht auch noch zusätzlich als Ton ausgegeben werde. Das Unterscheidungsmerkmal 1 sei naheliegend. Wenn der Fachmann ausgehend von der [X.] nach einer Lösung suche, um die Aufnahme der durch Symbol und [X.] ausgegebenen Zustandsinformation zu verbessern, so werde er sich fachüblicher Maßnahmen bedienen. Dazu gehöre zweifellos auch die Verwendung eines Lautsprechers zur Sprachausgabe. Das Unterscheidungsmerkmal 2 betreffe wiederum lediglich den Inhalt der über einen Lautsprecher wiedergegebenen Informationen. Dieser könne aber – wie bereits ausgeführt – nach der Rechtsprechung des [X.] keine erfinderische Tätigkeit begründen.

Dem Streitpatent fehle es an einer erfinderischen Tätigkeit auch ausgehend von der [X.]. Der Gegenstand des Anspruchs 1 des Streitpatents unterscheide sich von der Lehre der [X.] lediglich dadurch, dass der Benutzer zwar grafisch durch Zeichen und eine [X.] in Textform über den Zustand des Sprachfernbedienungssystems informiert werde, letztere Information werde aber nicht auch noch zusätzlich als Ton über den [X.] ausgegeben. Allein dies könne keine erfinderische Tätigkeit begründen. Auch insoweit fehle es an der erforderlichen Technizität im oben ausgeführten Sinne.

Selbst wenn man das Unterscheidungsmerkmal als ein technisches Mittel ansehen sollte, so werde es jedenfalls durch die [X.] selbst nahegelegt. Bei der technischen Wirkung handele es sich in diesem Fall um die verbesserte Aufnahme des Zustands des Sprachfernbedienungssystems durch den Nutzer. Hierauf basierend habe der Fachmann Veranlassung gehabt, die [X.] zusätzlich als Ton auszugeben, denn die [X.] betreffe gerade die Aufgabe, die Bedienung für Benutzer gehobenen Alters zu vereinfachen.

Aus vorgenannten Gründen seien auch die Ansprüche 3 und 4 des Streitpatents nicht patentfähig.

Die Ansprüche des Streitpatents seien im Laufe des Erteilungsverfahrens aufgrund zahlreicher Mängel sehr umfangreich geändert worden. Der Gegenstand in der erteilten Form sei aber nicht in der Anmeldung und der früheren Anmeldung offenbart, weshalb das Streitpatent aufgrund unzulässiger Erweiterung nichtig sei. Hierbei weist die Klägerin auf folgende Dokumente hin:

[X.] 1b Anmeldeunterlagen der [X.] Teilanmeldung 12152804.6

[X.] 8 Schriftverkehr der ehemaligen Anmelderin mit dem [X.] im Anmeldeverfahren

[X.] 9 EP 1 970 896 [X.] ([X.])

[X.] 9a englischsprachige Übersetzung der früheren [X.] PCT/[X.]/324064

Das Merkmal 1.4.1 sei zum Großteil mit der Eingabe der Anmelderin vom 29. Oktober 2012 aus der Beschreibung in den Anspruch 1 aufgenommen worden. Die ehemalige Anmelderin habe bezüglich der [X.] auf die Absätze 0053 und 0055 der Veröffentlichung der Anmeldung (diese seien identisch mit den Absätzen 0055 und 0057 des Streitpatents) verwiesen (vgl. Anlage [X.] 8). Weder in den angeführten Stellen der Beschreibung noch an anderer Stelle der ursprünglichen Anmeldeunterlagen finde sich jedoch eine [X.] für ein Verbotszeichen, welches in beliebiger Position angezeigt werde.

Die ursprünglichen Anmeldeunterlagen stützten ferner auch an keiner Stelle ein Löschen oder ein Austauschen des [X.] während des [X.].

Bereits aus den Figuren 1A und 1B der ursprünglichen Anmeldeunterlagen ergebe sich eindeutig, dass während des gesamten [X.] ein einziges Verbotszeichen angezeigt werden müsse. Dies ergebe sich ebenfalls aus dem Ablaufdiagramm in Figur 3 und der dazugehörigen Beschreibung. Die Anzeige des [X.] beginne mit der [X.] durch den Nutzer. Nach Abschluss des Einstelleitraums werde das Verbotszeichen von der Anzeige gelöscht.

Das Streitpatent sei auch gegenüber der [X.] unzulässig erweitert. Die Beschreibung der [X.] sei im Wesentlichen identisch mit der Beschreibung der [X.]. Das Streitpatent sei folglich auch gegenüber der [X.] unzulässig erweitert und daher für nichtig zu erklären.

Auch der [X.] des Streitpatents sei nicht patentfähig. Anspruch 2 lehre, dass nach Verstreichen des Einstellungszeitraums zwar das Verbotszeichen gelöscht werde, nicht aber der mindestens eine erkennbare Sprachtext. Dies ergebe sich jedoch in naheliegender Weise aus der [X.]. So lehre die [X.] in Figur 12, dass die Anzeige der erkennbaren Sprachbefehle im Fenster „Was kann ich sagen?" gleichzeitig mit dem Erkennungszeichen 78 angezeigt werde, das ein korrektes Erkennen anzeige. Da ein korrektes Erkennen voraussetzte, dass auch eine technisch bedingte Einstellung abgeschlossen sei, sei also das vom Anspruch 2 gezeigte Merkmal offenbart.

Der vormals zuständige 6. Senat hat den Parteien in einem qualifizierten Hinweis vom 9. Dezember 2020 seine vorläufige Auffassung zur Sach- und Rechtslage mitgeteilt und den Parteien eine abschließende Frist bis 12. März 2021 gesetzt. Im Termin am 26. Mai 2021 hat der Senat den Parteien einen weiteren rechtlichen Hinweis erteilt.

Die Klägerin beantragt,

das [X.] Patent 2 447 941 mit Wirkung für das Hoheitsgebiet der [X.] für nichtig zu erklären.

Die Beklagte beantragt,

die Klage abzuweisen,

hilfsweise die Klage mit der Maßgabe abzuweisen, dass das Streitpatent mit dem Anspruch 2 aufrecht erhalten bleibt.

Sie rügt Verspätung der [X.], die daher zurückzuweisen sei, und tritt der Auffassung der Klägerin in allen Punkten entgegen und verteidigt das Streitpatent in der erteilten Fassung sowie hilfsweise allein den Anspruch 2.

Das Streitpatent sei neu gegenüber den [X.]. Bei der [X.] werde das Computer Waiting Signal nicht ausgegeben, nachdem der Computer 12 das Activation Signal empfangen habe, sondern unabhängig von einem Empfang durch den Computer 12 oder davor. Darüber hinaus offenbare die [X.] auch nicht die konkreten Ausgestaltungen der verschiedenen Ausgaben, z. B. kein Verbotszeichen und keine erkennbaren Sprachtexte.

Es fehle dem Streitpatent auch nicht an der erfinderischen Tätigkeit ausgehend von der [X.]. Die in der [X.] beschriebene Spracherkennungsvorrichtung sei nämlich nicht derart eingerichtet, dass die Ausgabe des [X.] während des [X.] begonnen werde. Entsprechendes gelte für die Ausgabe von erkennbaren Sprachtexten und/oder einer [X.] und/oder einer entsprechenden Tonausgabe. Diese Unterscheidungsmerkmale brächten konstruktive und technische Unterschiede zwischen der beanspruchten Erfindung und der [X.] zum Ausdruck, die sich insbesondere im zeitlichen Ablauf der Ausgabevorgänge (Anzeige, Ton) widerspiegelten.

Die Unterscheidungsmerkmale erschöpften sich auch nicht in einer bloßen Wiedergabe einer Information und zielten auch nicht nur darauf ab, dem Benutzer einen bestimmten Inhalt zu vermitteln oder durch den Inhalt die Bedienbarkeit zu verbessern. Im Hinblick auf die technischen Unterscheidungsmerkmale sei es vielmehr Aufgabe des Streitpatents, den Benutzer in seiner Interaktion mit der Spracherkennungsvorrichtung derart zu führen, dass Eingabefehler und unnötige Verzögerungen wegen des notwendigen Einstellprozesses minimiert würden.

Ein Merkmal könne nicht bereits schon deswegen bei der Beurteilung der erfinderischen Tätigkeit außer [X.] gelassen werden, weil es die Darstellung von Information betreffe. Diese Folgerung stimme insbesondere dann nicht, wenn ein derartiges Merkmal zur Lösung eines technischen Problems mit technischen Mitteln beitrage, wie dies vorliegend der Fall sei.

Die Unterscheidungsmerkmale bewirkten im vorliegenden Fall jedenfalls eine geführte Mensch-Maschine-Interaktion und bedienten sich der u. a. visuellen Anzeige der technischen Bedingungen der Maschine und trügen somit zu einer technischen Lösung eines technischen Problems bei.

Entgegen der Auffassung der Klägerin sei eine Darstellung dergestalt, dass neben einem Verbotszeichen zugleich weitere Informationen hinsichtlich eines Zeitraums nach Aufhebung des „Verbots“ angezeigt werden, zum Anmeldezeitpunkt nicht üblich gewesen. Entsprechendes folge insbesondere auch nicht aus der [X.]. Bei vorgenannter Darstellung handele es sich vielmehr um ein besonderes Charakteristikum des Streitpatents.

Ausgehend von der [X.] sei der Gegenstand des Anspruchs 1 des Streitpatents aber auch nicht in Kombination mit der [X.] nahegelegt.

Im Kontext der Figur 12 der [X.] sei zwar beschrieben, dass ein Fenster 82 mit zulässigen Sprachanweisungen (global voice commands) angezeigt werden könne. Der Fachmann würde aber die in der [X.] beschriebene Anzeige nicht auf die [X.] übertragen, um die technische Aufgabe zu lösen, den Benutzer in seiner Interaktion mit der Spracherkennungsvorrichtung derart zu führen, dass Eingabefehler und unnötige Verzögerungen wegen des notwendigen Einstellprozesses minimiert würden.

Die [X.] beschreibe nämlich keine mit Merkmal 1.4.1b vergleichbare Anzeige der erkennbaren Sprachtexte. Die [X.] motiviere vielmehr dazu, das Fenster 82 vor einer erneuten Spracherkennung wieder zu schließen (um nicht andere Fenster zu verdecken). Das Fenster 82 würde also nicht während eines folgenden [X.] (der bei [X.] ohnehin nicht relevant sei) geöffnet bleiben.

Zudem spreche die [X.] an keiner Stelle einen Einstellprozess bzw. Einstellzeitraum an. Sofern man annehme, dass beim Umschalten von dem "non-listening state" auf den "listening state" Verzögerungen aufträten, so erfolgten diese aus fachmännischer Sicht auf Zeitskalen, die für die vorliegende Erfindung irrelevant seien. Das genannte Problem, dass aufgrund des Einstellprozesses Eingabefehler oder Verzögerungen auftreten könnten, werde insofern von der [X.] überhaupt nicht adressiert und der Fachmann würde die [X.] daher nicht zur Lösung der gestellten Aufgabe in Betracht ziehen.

Da die [X.] nicht die Unterscheidungsmerkmale zur [X.] zeige, würde auch eine Kombination von [X.] und [X.] nicht zu einem Gegenstand mit den Merkmalen des Anspruchs 1 führen. Eine Kombination von [X.] und [X.] würde auch nicht die Aufgabe lösen, den Benutzer in seiner Interaktion mit der Spracherkennungsvorrichtung derart zu führen, dass Eingabefehler und unnötige Verzögerungen wegen des notwendigen Einstellprozesses minimiert würden. Der Gegenstand des Anspruchs 1 und entsprechend die Ansprüche 3 und 4 seien daher durch eine Kombination von [X.] und [X.] nicht nahegelegt.

Auch ausgehend von der [X.] sei der Gegenstand des Anspruchs 1 nicht nahegelegt. Von der [X.] unterscheide sich der Gegenstand des Anspruchs 1 durch die Merkmale 1.4.1.a bis 1.4.1.c, 1.4.2 und 1.4.3. Die Beurteilung der erfinderischen Tätigkeit führe daher zu einem ähnlichen Ergebnis, wie ausgehend von der [X.].

Die vorgenannten Unterscheidungsmerkmale definierten technische Aspekte, wie insbesondere den zeitlichen Ablauf von Vorgängen (Anzeige während der "[X.]" und Löschen des [X.] nach der "[X.]") und lieferten schon allein deshalb einen Beitrag zur Lösung eines technischen Problems mit technischen Mitteln.

Der Gegenstand des Anspruchs 1 (und entsprechend die Gegenstände der Ansprüche 3 und 4) beruhe daher auf einer erfinderischen Tätigkeit im Hinblick auf die [X.].

Da der Anspruch 2 von Anspruch 1 abhängig sei, werde die Patentfähigkeit von Anspruch 2 aus den vorstehend genannten Gründen ebenfalls nicht in Frage gestellt.

Entgegen der Auffassung der Klägerin sei der Anspruch 1 im Laufe des Erteilungsverfahrens auch nicht unzulässig geändert worden, insbesondere betreffend die Position des "prohibition mark" und die Dauer der Anzeige des "prohibition mark".

Die Anzeige gemäß Merkmal 1.4.1.a sei jedenfalls in Absatz 0052 i. A. 0053 der veröffentlichten Fassung der ursprünglichen Anmeldung unmittelbar und eindeutig offenbart. Dort gehe es darum, dass die Anzeige des "prohibition mark" während der "[X.]" begonnen werde, ohne dass die Position der Anzeige näher definiert werde. Bei der vorliegenden [X.] wiesen gerade nicht sämtliche Ausführungsbeispiele das Merkmal auf, dass die Position des [X.] festgelegt sei. So offenbare die [X.] eben auch Ausführungsformen, bei denen das Verbotszeichen die Liste 1 nicht überlagert.

Es sei auch gemäß der in der ursprünglichen Anmeldung dargestellten technischen Lehre nicht zwingend erforderlich, dass die Anzeige des "prohibition mark" während der gesamten "[X.]" erfolge. Unabhängig davon offenbarten die ursprünglichen Anmeldungsunterlagen sehr wohl, dass die Position des [X.] gewechselt werde, d. h. ein Löschen oder ein Austauschen des [X.] erfolgen könne, bevor die Spracherkennung ausgeführt werde.

Wegen der weiteren Einzelheiten des Vorbringens der Parteien wird auf die Schriftsätze der Parteien nebst Anlagen und den weiteren Inhalt der Akte Bezug genommen.

Entscheidungsgründe

Die auf unzulässige Erweiterung sowie mangelnde Patentfähigkeit (Art. 138 Abs. 1 Buchstaben a), c) [X.] Art. 54, 56 EPÜ [X.] Art. II § 6 Abs. 1 S. 1 Nr. 1, 3 [X.]) des [X.] gestützte Klage ist zulässig aber unbegründet. Der Gegenstand des [X.] in der erteilten Fassung, der nicht unzulässig erweitert ist, erweist sich als neu und auf erfinderischer Tätigkeit beruhend, mithin auch als patentfähig und damit rechtsbeständig. Auf den Hilfsantrag kam es daher nicht mehr an.

Soweit die Klägerin die Nichtigkeitsklage bei gleichbleibendem [X.] mit Schriftsatz vom 29. Januar 2021 um den Anspruch 2 erweitert hat, handelt es sich hierbei um eine zulässige Klageerweiterung gemäß § 99 Abs. 1 [X.] [X.] § 264 Nr. 2 ZPO. Klageerweiterungen sind bis zum rechtskräftigen Abschluss des Verfahrens möglich (vgl. [X.], 6. Auflage, 2020, § 264, Rdnr. 15).

I.

1. Das Streitpatent betrifft eine [X.], ein Anzeigeverfahren und ein Anzeigeverarbeitungsprogramm.

Nach den sinngemäßen Angaben in der [X.] sei aus dem Stand der Technik eine [X.] bekannt, die abhängig vom Zustand der Vorrichtung eine Liste mit den jeweils erkennbaren Sprachtexten auf einem Display anzeige, so dass ein Nutzer problemlos einen der Texte aus der Liste auswählen und sprechen könne (Absatz 0004).

Um während einer normalen Unterhaltung eine Spracherkennung und dadurch unabsichtlich ausgelöste Befehle zu vermeiden, würden zudem einige [X.]en einen [X.] nur dann ausführen, nachdem der Benutzer eine vorbestimmte Bedienungshandlung vorgenommen habe, etwa das Drücken einer Taste. Zwischen dem Tastendruck und der Bereitschaft zur Spracherkennung vergehe noch eine bestimmte [X.]spanne, in der Vorbereitungs- und Initialisierungsprozesse o. ä. stattfänden. Daher könne in nachteiliger Weise ein Teil der Sprache nicht richtig empfangen werden, wenn ein ungeübter Nutzer sofort nach dem Drücken der [X.] zu sprechen beginne. Dementsprechend sei es in der Vergangenheit üblich gewesen, den Nutzer durch ein akustisches Signal über den [X.]punkt zu informieren, zu dem mit der Spracheingabe begonnen werden solle (Absätze 0005-0007). Die [X.] 2003-177789 offenbare die Anzeige eines Bildes mit einer Bewegung in einem vorbestimmten Displaybereich, um den Nutzer intuitiv über den [X.]punkt zu informieren, ab dem eine Spracheingabe möglich ist (Absätze 0008, 0009).

Ohne Hinweis auf konkreten Stand der Technik führt das Streitpatent aus, dass es einem ungeübten Benutzer bei Konzentration auf eine Spracheingabeliste schwerfalle, ein den [X.]punkt der Spracheingabe signalisierendes Bewegtbild in einem bestimmten Displaybereich zu erkennen, um die Spracheingabe zum richtigen [X.]punkt zu starten (Absatz 0010).

In Anbetracht dieses Problems sei es eine Aufgabe der Erfindung, eine [X.], ein Anzeigeverfahren und ein Anzeigeverarbeitungsprogramm bereitzustellen, mittels derer der Nutzer leicht erkennen könne, wann eine Spracheingabe erfolgen soll, sogar während er eine auf einem Bildschirm des Geräts mit [X.] angezeigte Liste der möglichen [X.] beobachte (Absatz 0011).

Diese Aufgabe soll u. a. mit einer [X.] nach Anspruch 1 gelöst werden

2. Als zuständigen Fachmann sieht der Senat einen Ingenieur der Elektrotechnik oder Informatik mit Erfahrung in der Entwicklung und Implementierung von Spracherkennungssystemen.

3. Mehrere Angaben im Anspruch 1 bedürfen näherer Betrachtung:

a) Die [X.] ist nicht ständig einsatzbereit. Vielmehr benötigt sie einen Einstellzeitraum ([X.], Merkmal 1.3), um von einem ersten Zustand der Vorrichtung, dem Empfang von Anweisungen in der [X.] zum Beginnen des [X.]es, zu einem zweiten Zustand der Vorrichtung zu gelangen, in dem die [X.] zum Ausführen des [X.]es bereit ist. Der Anspruch 1 nennt zudem einen dritten Zustand der Vorrichtung, den Beginn bzw. Start des [X.]es (Merkmale 1.3.1, 1.4.3), welcher unmittelbar nach dem Ende des [X.] oder später erreicht wird.

Welche Verarbeitungsschritte die [X.] während des [X.] konkret ausführt, ist nicht vorgegeben. Der Einstellzeitraum ist insbesondere nicht durch die Verarbeitungsschritte beschränkt, die in der [X.] als Stand der Technik angegeben werden (Absatz 0006):

- Auslesen eines Programms für einen [X.] von einem Aufzeichnungsmedium oder dergleichen,

- Reservieren eines Bereichs, in dem eine empfangene Sprache als Sprachinformation gespeichert werden soll.

Das Streitpatent liefert keine konkreten Zahlenwerte für die Dauer des [X.]. Dieser ist zumindest so lang, dass eine verfrühte Spracheingabe des Benutzers zu besorgen ist. Zudem dürfte die Anzeige des [X.] nur dann sinnvoll sein, wenn es vom Benutzer wahrgenommen werden kann. Damit dürfte eine typische Dauer des [X.] im Bereich einiger Sekunden liegen.

b) Die [X.] soll auf einem Anzeigemittel das Anzeigen von drei verschiedenen Elementen beginnen, eines [X.], mindestens eines von erkennbaren Sprachtexten und einer [X.] (Merkmale 1.4.1 bis [X.]).

Diese Anweisungen bezieht der Fachmann auf nicht näher bestimmte [X.]punkte nachdem die [X.] Anweisungen zum Beginnen des [X.]es von dem [X.] empfangen hat und auf nicht näher bestimmte Positionen auf dem Anzeigemittel, d. h. irgendwann nach dem Beginn des [X.] ist das Anzeigen eines [X.], des mindestens einen von erkennbaren Sprachtexten und einer [X.] an jeweils nicht näher bestimmten Positionen auf dem Anzeigemittel zu beginnen. Denn keine Stelle der [X.] gibt Anlass zu der Annahme, dass mit diesen Anzeigen bereits begonnen werden soll, bevor der Nutzer Anweisungen zum Beginnen des [X.]es gegeben hat (vgl. Merkmale 1.1.2, 1.3), auch nicht die in Absatz 0011 angegebene Aufgabe der Erfindung, so dass der Fachmann eine solche Ausgestaltung auch nicht mitliest. Auf Grund der Anweisungen im Anspruch 1, Merkmale 1.4.2 und 1.4.3, im [X.] und in der Beschreibung, Absatz 0016, Zeilen 9-14 schließt der Fachmann zudem aus, dass die genannten Anzeigen erst nach dem Einstellzeitraum beginnen.

Zumindest während eines Teils des [X.] werden somit Verbotszeichen, erkennbarer Sprachtext und [X.] zugleich auf dem Anzeigemittel dargestellt.

Die Position des [X.], des [X.] und der [X.] auf dem Anzeigemittel lässt der Anspruch 1 offen. Er umfasst sowohl die Variante, bei der das Verbotszeichen den angezeigten Sprachtext zu einem bestimmten [X.]punkt überlagert (Figur 1A), als auch die Variante, dass das Verbotszeichen den angezeigten Sprachtext nicht überlagert (Figur [X.]). Die [X.] beschreibt hierzu eine erste, nicht patentbeschränkende Ausführungsform (Absatz 0017 ff., Figuren 1A, 1B) und eine zweite, ebenfalls nicht patentbeschränkende Ausführungsform (Absatz 0064 ff., Figuren [X.], [X.], 5) der Anzeigen eines Navigationssystems (Absatz 0015: a navigation apparatus which guides a car along a route). Bei beiden Ausführungsformen werden, unmittelbar (immediately) nachdem ein Nutzer eine Sprachtaste gedrückt hat, eine Liste 1 von Sprachtexten, die von einem Verbotszeichen 3 überlagert ist, und eine [X.] 4 angezeigt (Absätze 0017, 0018 und Figur 1A bzw. Absatz 0070 und Figur [X.]). In der zweiten Ausführungsform wird zudem, beispielsweise während des [X.], die Position des [X.] auf dem Bildschirm geändert (Absätze 0071, 0072, Figur [X.] [X.] [X.]).

Abbildung

 [X.], Figuren 1A und [X.] mit Verbotszeichen 3, [X.] 4 und einer Liste 1 erkennbarer Sprachtexte

c) Ein Verbotszeichen (prohibition [X.], Merkmal 1.4.1a) ist ein grafisches Sinnbild, welches das Verbot eines [X.] indiziert. Eine Textnachricht stellt kein Verbotszeichen im Sinne des [X.] dar. Denn das Streitpatent unterscheidet konsequent zwischen der Anzeige von Texten, insbesondere Nachrichtentexten, wie der „[X.] 2a“, der „[X.] 2b“ oder der „guidance message 4“ und der Anzeige von Zeichen, insbesondere dem im Merkmal 1.4.1a genannten „prohibition [X.] 3“ beispielweise einem Verbotsbild (Absatz 0018: prohibition image).

Das Verbotszeichen ist nach der Lehre des Anspruchs 1 von dem Anzeigemittel zu löschen, nachdem der [X.] gestartet wurde (Merkmal 1.4.3). In der Weiterbildung nach [X.] wird das Verbotszeichen zu einem früheren [X.]punkt gelöscht: nach dem Verstreichen eines [X.] wird das Verbotszeichen gelöscht und (weiterhin) der mindestens eine von erkennbaren Sprachtexten angezeigt.

d) Eine [X.] (guidance message, Merkmal [X.]) gibt dem Nutzer eine Handlungsanleitung. In den Ausführungsbeispielen lautet die [X.] in dem Navigationssystem „Bitte sprechen Sie, wenn Sie einen Piepton hören“ (Absatz 0023, Figuren 1A, 1B) bzw. „Bitte drücken Sie die Sprachtaste und sprechen Sie“ (Figur [X.]).

e) Erkennbare Sprachtexte (recognizable speeches, Merkmal 1.4.1b) sind Texte, die bei Spracheingabe des Nutzers von der [X.] erkennbar und in einen Maschinenbefehl umsetzbar sind.

Im Ausführungsbeispiel des [X.] sind die durch das Navigationssystem erkennbaren Sprachtexte situationsabhängig. In der Situation, in der ein Befehl erwartet wird, werden beispielsweise die Sprachtexte „Ziel suchen“, „Karte anzeigen“, „Route anzeigen“ o. ä. angezeigt. In der Situation, in der die Vorrichtung ein Navigationsziel erwartet, werden beispielsweise „Bahnhof“, „[X.]“, „Vergnügungspark“ o. ä. angezeigt (Absatz 0019).

f) Bei der Anzeige eines [X.], des mindestens einen von erkennbaren Sprachtexten und einer [X.] (Merkmale 1.4.1a bis [X.]) handelt es sich nicht um die Wiedergabe einer Information als solcher (Art. 52 Abs. 2 Buchst. d, Abs. 3, Art. 56 EPÜ), sondern um technische Mittel, die ein technisches Problem lösen ([X.], Urteil vom 25. August 2015 – [X.] – [X.], Rn 18; [X.], Urteil vom 14. Januar 2020 – [X.] – Rotierendes Menü, Rn 26). Denn durch die Merkmale 1.4.1a bis [X.] wird die Mensch-Maschine-Schnittstelle so gestaltet, dass Eingabefehler und unnötige Eingabeverzögerungen minimiert werden. Ohne die Anzeige eines [X.], des mindestens einen von erkennbaren Sprachtexten und einer [X.] würde sich der [X.] bzw. -erkennungsprozess regelmäßig verlängern oder wäre – etwa für einen ungeübten Benutzer ohne Bedienungsanleitung – überhaupt nicht durchführbar.

Die Darstellung mindestens einen von erkennbaren Sprachtexten auf dem Anzeigemittel erzielt die technische Wirkung, dass der beanspruchten [X.] ein erkennbarer Sprachtext durch den Benutzer zugeführt werden kann.

Die Darstellung mindestens eines von erkennbaren Sprachtexten, begleitet von einem Verbotszeichen, erzielt die technische Wirkung, dass der [X.] unmittelbar dann, wenn sie zur Spracherkennung bereit ist, und ohne Verzögerung ein erkennbarer Sprachtext durch den Benutzer zugeführt werden kann.

II.

1. Der [X.] der unzulässigen Erweiterung liegt nicht vor (Art. 138 Abs. 1 Buchstabe c) EPÜ, Art. II § 6 Abs. 1 Nr. 3 IntPatÜG).

Denn der Gegenstand des [X.] geht in zulässiger Weise auf den Inhalt der [X.] Patentanmeldung in ihrer ursprünglich eingereichten Fassung und auf den Inhalt der früheren [X.] Patentanmeldung in ihrer ursprünglich eingereichten Fassung zurück.

1.1 Die einzelnen Merkmale des erteilten Anspruchs 1 gehen in zulässiger Weise auf folgende Fundstellen der am 27. Januar 2012 beim Europäischen Patentamt eingegangenen Anmeldeunterlagen der [X.] (= [X.] 1b) zurück:

Merkmale 1, 1.1: Anspruch 1 und Absatz 0001;

Die Begriffe „words“ und „speech“ werden in der [X.] 1b synonym verwendet.

Merkmal 1.1.2: Anspruch 1 und Absätze 0048, 0049;

Das im erteilten Anspruch 1 beanspruchte [X.] ist [X.] als Empfangsmittel zum Empfangen von Spracherkennungsstartanweisungen des Nutzers (Anspruch 1) und als Steuereinheit, die die [X.] steuert, um einen [X.] zu starten (Absätze 0048, 0049).

Merkmal 1.1.3: Anspruch 1;

Merkmal 1.1.4: Absatz 0013, Bezugszeichen 107;

Merkmal 1.2: Anspruch 1;

Merkmale 1.3, 1.3.1: Absatz 0039, Zeilen 2-8;

Merkmale 1.4 bis [X.]: Anspruch 1, Zeilen 11-14, Absatz 0014, Zeilen 8-11;

Da nach Anspruch 1, Zeilen 11-14 das [X.] das Anzeigemittel zum Anzeigen des mindestens einen erkennbaren [X.] und eines Verbotsbilds nach einem ersten [X.]punkt, nämlich nach dem Empfang der [X.], und vor einem zweiten [X.]punkt ansteuert, nämlich vor dem [X.]punkt, zu dem das Erkennungsmittel zur Spracherkennung bereit ist, beginnt das Anzeigen dieser Elemente innerhalb des [X.].

Nach Absatz 14, Zeilen 8-11 kann das Anzeigen einer Nachricht und eines Verbotsbildes während des [X.] beginnen, denn dort ist angegeben: Zu diesem [X.]punkt werden während eines [X.]raums vom Drücken der Sprachtaste des Nutzers zum Anweisen des Starts des [X.]es bis zum tatsächlichen Start des [X.]es eine Nachricht und ein Verbotszeichen, das ein Sprachverbot bedeutet, auf einem Bildschirm angezeigt. Als Nachricht versteht der Fachmann insbesondere die [X.] (Absatz 0013, Bezugszeichen 4).

Merkmal 1.4.2: Absatz 0050;

Merkmal 1.4.3: Anspruch 2.

Es trifft zu, dass nicht alle Merkmale der Ausführungsbeispiele in den erteilten Anspruch 1 aufgenommen worden sind. Nicht aufgenommen wurde etwa die Position der Anzeigen gemäß Figur 1A. Diese Verallgemeinerung ist auf Grund der allgemeinen Lehre des ursprünglichen Anspruchs 1 und des Absatzes 0014 zulässig.

1.2 Der Gegenstand des erteilten Anspruchs 1 geht in zulässiger Weise auf die am 1. Dezember 2006 eingegangenen japanisch-sprachigen Anmeldeunterlagen der früheren [X.] PCT/[X.]/324064 zurück (genannt sind im Folgenden Fundstellen der am 23. Juli 2008 beim Eintritt in die europäische Phase, europäische Anmeldenummer 06823543.1, eingereichten englischsprachigen Übersetzung (= [X.] 9a), Übersetzungsfehler oder -ungenauigkeiten wurden von der Klägerin nicht geltend gemacht und sind dem Senat auch nicht offenbar):

Merkmale 1, 1.1: Anspruch 1;

Merkmal 1.1.2: Anspruch 1 und Absätze 0050, 0051;

Das im erteilten Anspruch 1 beanspruchte [X.] ist [X.] als Sprachtaste (Absatz 0050) und als Steuereinheit, die die [X.] steuert, um einen [X.] zu starten (Absätze 0050, 0051 oder auch Anspruch 1).

Merkmal 1.1.3: Anspruch 1;

Merkmal 1.1.4: Absatz 0015, Bezugszeichen 107;

Merkmal 1.2: Anspruch 1;

Merkmale 1.3, 1.3.1: Absatz 0041, Zeilen 2-8;

Merkmale 1.4, 1.4.1 Absatz 0011, Zeilen 10, 11

Merkmale 1.4.1a bis [X.]: Absatz 0016, Zeilen 8-11, Anspruch 1, Zeilen 7, 8;

Absatz 0016, Zeilen 8-11 offenbart: Zu diesem [X.]punkt werden während eines [X.]raums vom Drücken der Sprachtaste des Nutzers zum Anweisen des Starts des [X.]es bis zum tatsächlichen Start des [X.]es eine Nachricht und ein Verbotszeichen, das ein Sprachverbot bedeutet, auf einem Bildschirm angezeigt. Demnach soll das Anzeigen dieser Elemente also während des [X.] beginnen.

Unter den allgemeinen Begriff der Nachricht wird der Fachmann insbesondere die [X.] (Absatz 0015, Bezugszeichen 4) subsummieren. Die Anzeige des mindestens einen von erkennbaren Sprachtexten ist in den Absätzen 0051, 0052 oder Anspruch 1, Zeilen 7, 8 offenbart.

Merkmal 1.4.2: Absatz 0052;

Merkmal 1.4.3: Anspruch 1.

Es trifft ebenfalls zu, dass nicht alle Merkmale des ursprünglichen Anspruchs 1 oder der Ausführungsbeispiele in den erteilten Anspruch 1 aufgenommen worden sind. Nicht aufgenommen wurde etwa die Anweisung, das Verbotsbild in einer Position anzuzeigen, die mit mindestens einem Teil des erkennbaren Zeichens auf dem Anzeigemittel überlagert ist ([X.] 9a, Anspruch 1, Zeilen 15-17). Diese Verallgemeinerung ist jedoch auf Grund der allgemeinen Lehre des ursprünglichen Absatzes 0016 zulässig.

1.3 Der Gegenstand des erteilten Unteranspruchs 2 ist [X.] in [X.] 1b, Absätze 0051, 0052, Figur 1B bzw. in [X.] 9a, Absätze 0053, 0054 und Figur 1B. Hinsichtlich der übrigen erteilten Ansprüche ist dem Senat keine unzulässige Erweiterung offenbar.

2. Der [X.] der fehlenden Patentfähigkeit liegt nicht vor (Art. 138 Abs. 1 Buchstabe a) [X.] Art. 54, 56 EPÜ [X.] Art. II § 6 Abs. 1 S. 1 Nr. 1 IntPatÜG).

2.1 Die Schrift [X.] 6,505,159 B1 (= [X.] 5) ist ein geeigneter Ausgangspunkt des Fachmanns, der vor der vorstehend genannten Aufgabe steht. Der Gegenstand des Anspruchs 1 des [X.] ist gegenüber diesem Stand der Technik neu.

a) Die Schrift [X.] 5 beschreibt eine Vorrichtung und ein Verfahren zur Bereitstellung von Spracheingabe für ein Spracherkennungssystem (Bezeichnung). Die Vorrichtung 10 umfasst einen Computer 12 u. a. mit einem [X.] und ein entfernt vom Computer 12 angeordnetes Eingabegerät 14, welches in einer ersten Ausgestaltung ein schnurloses Telefon umfasst, das aus einer Basisstation 16 und einem tragbaren Mobilteil 18 besteht (Figur 1 und Spalte 2, Zeilen 20-31; Spalte 5, Zeilen 30-35).

Abbildung

[X.] 5, Figur 1 mit Ergänzungen durch den Senat

Eine Telefon/Computer-Schnittstelleneinheit und Steuerung 87 in der Basisstation 16 (Figur [X.]) ist über eine geeignete Schnittstelleneinheit (nicht in Figur 2A gezeigt), die mit geeigneten Protokollen kommuniziert, mit dem Systembus 23 des [X.] verbunden (Figur 2A). In einer Ausführungsform entsprechen die Schnittstelleneinheit und das Protokoll dem [X.] (universal serial bus). Der [X.] weist bestimmte Attribute auf, wie beispielsweise eine erhöhte Bandbreite gegenüber früheren seriellen Kommunikationsverbindungen, wodurch mehr Sprachdaten vom Eingabegerät 14 an den Computer 12 geliefert werden können (Spalte 4, Zeile 60 bis Spalte 5, Zeile 4).

Entgegen der Auffassung der Beklagten fällt diese in der [X.] 5 offenbarte räumlich verteilte Vorrichtung unter den Anspruch 1 des [X.]. Denn der Anspruch 1 ist nicht darauf beschränkt, dass die funktionalen Einheiten der [X.] innerhalb eines Gehäuses miteinander verbunden sind. Im Übrigen ist dem Fachmann bekannt, dass ein schnurloses Telefon, dessen Basisstation 16 über [X.] mit einem Computer 12 verbunden ist, regelmäßig auch in unmittelbarer Nähe des [X.] betrieben wird.

b) Die Schrift [X.] 5 zeigt in Figur 4 ein Flussdiagramm zum Betrieb der Vorrichtung 10, dessen einzelne Schritte ab Spalte 5, Zeile 52 bis Spalte 7, Zeile 29 beschrieben sind.

Abbildung

[X.] 5, Figur 4 mit Ergänzungen durch den Senat

Der [X.]raum zwischen den Schritten 104 und 114 stellt einen Einstellzeitraum ([X.]) gemäß Merkmal 1.3 des [X.] dar.

Denn im Schritt 102 betätigt der Nutzer den [X.] 72 am Eingabegerät 14, um dem Computer 12 anzuzeigen, dass eine Spracheingabe erfolgen soll. Im Schritt 104 wird daraufhin ein [X.] (activation signal) von dem Eingabegerät 14 zum Computer 12 übertragen (Spalte 5, Zeilen 53-57). In der dargestellten Ausführungsform stammt das [X.] vom Mobilteil 18 und wird an die Basisstation 16 übertragen. Die Basisstation 16 sendet dann das [X.] über die Treiber 96 an das Programmmodul 37 des [X.], um anzuzeigen, dass der Nutzer Sprachanweisungen eingeben möchte (Spalte 5, Zeilen 59-66). Nach dem Empfang des [X.]s unterbricht das Programmmodul 37 aktuelle Operationen, wie das Abspielen einer aufgezeichneten Nachricht, und bereitet das [X.] auf den Empfang nachfolgender Sprachanweisungen in Schritt 112 vor. Die Vorbereitung des [X.] kann das Bereitstellen eines Satzes zulässiger Sprachanweisungen basierend auf dem aktuellen Status des Programms umfassen (Spalte 6, Zeilen 22-39).

Mit dem auf den Schritt 104 folgenden Schritt 106 erzeugt die Basisstation 16 ein [X.] (computer waiting signal) und sendet es an das Mobilteil 18, das einen akustischen Ton auslöst, der dem Nutzer anzeigt, dass das Eingabegerät 14 versucht, eine Verbindung zum Computer 12 herzustellen. Beispielsweise kann sich der Computer 12 in einem „[X.] befinden, in dem ausgewählte Komponenten ausgeschaltet wurden, um Energie zu sparen. In einem solchen Fall kann das [X.] an den Nutzer übertragen werden, bis der Computer 12 voll funktionsfähig geworden ist (Spalte 5, Zeile 64 bis Spalte 6, Zeile 8). Das [X.] kann auch als Audio-Nachricht „Bitte warten“ ausgegeben werden (Spalte 7, Zeilen 39-41).

Nach der Vorbereitung des [X.] im Schritt 112 liefert das Programmmodul 37 im Schritt 114 über das Eingabegerät 14 ein [X.] ([X.]) an den Nutzer, das anzeigt, dass das System und insbesondere das [X.] bereit sind, Sprachanweisungen vom Nutzer anzunehmen. In der dargestellten Ausführungsform wird das [X.] von der Basisstation 16 zum Mobilteil 18 übertragen und löst einen vom Nutzer hör- und erkennbaren Ton aus (Spalte 6, Zeilen 34-43).

c) Der Stand der Technik nach der Schrift [X.] 5 offenbart somit eine [X.] gemäß Merkmal 1 (apparatus 10) mit einer [X.] gemäß Merkmal 1.1 (computer 12) zum Ausführen eines [X.]es des Erkennens der Sprache des Nutzers (Spalte 2, Zeilen 18-23; Spalte 5, Zeilen 30-32), einem [X.] gemäß Merkmal 1.1.2 (umfassend u. a. speech recognition switch 72) zum Empfangen von [X.] von einem Nutzer und zum Anweisen der [X.] (activation signal), den [X.] zu beginnen (Spalte 5, Zeilen 53-57; Spalte 6, Zeilen 22-26), einem Anzeigemittel gemäß Merkmal 1.1.3 (Spalte 7, Zeilen 30-39: LCD), welches zum Anzeigen mindestens eines von erkennbaren Sprachtexten der [X.] geeignet ist, einer [X.] gemäß Merkmal 1.1.4 (Spalte 4, Zeilen 24, 25: audio processor unit 64) und einem [X.] gemäß Merkmal 1.2 (bestehend aus [X.], telephone/computer interface unit and controller 87, [X.], [X.], vgl. Figuren 2A und [X.]). Wobei auch dort ein Einstellzeitraum gemäß Merkmal 1.3 ab einer [X.] (Figur 4 Schritt 104), zu der die [X.] Anweisungen zum Beginnen des [X.]es von dem [X.] 72 empfängt (Spalte 5, Zeilen 53-64) bis zu einer [X.] (Figur 4 Schritt 114), zu der die die [X.] zum Ausführen des [X.]es bereit ist, notwendig ist (Spalte 6, Zeilen 33-38), wobei der [X.] gemäß Merkmal 1.3.1 begonnen wird (Figur 4 Schritte 116-120), nachdem der Einstellvorgang vollendet wurde (Spalte 6, Zeile 44), und das [X.] (21, 87, 89, 68) gemäß Merkmal 1.4 dafür eingerichtet ist, die [X.] (audio processor unit 64) zu veranlassen, gemäß einem Teil des Merkmals 1.4.2 eine [X.] (please wait) während des [X.] (Figur 4 Schritt 106) als Ton auszugeben (Spalte 5, Zeilen 64-67; Spalte 6, Zeilen 6-8; Spalte 7, Zeilen 39-47).

Der Stand der Technik nach der Schrift [X.] 5 zeigt weder die Merkmale 1.4.1 bis [X.] noch das Merkmal 1.4.3 sowie nur einen Teil des Merkmals 1.4.2 des Anspruchs 1.

d) Den zahlreichen von Klägerin bzw. Beklagter gegen die vorstehende Beurteilung des [X.] der Schrift [X.] 5 vorgebrachten Einwänden folgt der Senat aus den folgenden Gründen nicht:

Entgegen der Auffassung der Klägerin ist in der Schrift [X.] 5 nicht offenbart, dass das Anzeigemittel zu veranlassen ist, das Anzeigen des mindestens einen von erkennbaren Sprachtexten (Merkmal 1.4.1b) und einer [X.] zu beginnen (Merkmal [X.]). Denn das [X.] und erkennbare Sprachtexte sind weder in der Aufzählung in Spalte 7, Zeile 30 ff. der Schrift [X.] 5 genannt, noch lassen sich diese unmittelbar und eindeutig aus dem Unterschied zwischen den Angaben „each of these signals“ und „each of the signals“ in Spalte 7, Zeilen 35, 39 der [X.] 5 entnehmen. Die [X.] 5 offenbart zwar das Bereitstellen eines Satzes zulässiger Sprachanweisungen (allowable voice instructions) bzw. einer gültigen Anweisung (valid instruction) im [X.] 98 (Spalte 6, Zeile 26-33). Eine Anzeige dieser Sprachanweisungen auf einem Anzeigemittel ist jedoch weder dort noch an anderer Stelle der [X.] 5 mitzulesen. So betreffen die Ausführungen in [X.] 5 Spalte 7, Zeile 30ff. das Wiederholen einer erkannten Sprachanweisung (repeating the recognized instruction) durch eine Audio-Nachricht an Stelle oder in Ergänzung für das sogenannte [X.] (recognized signal). Die Anzeige eines erkannten [X.] ist etwas Anderes als die im Merkmal 1.4.1b beanspruchte Anzeige eines erkennbaren, d. h. noch zu erkennenden [X.], denn ein erkannter Sprachtext kann erst nach einer Spracherkennung und somit nach dem Einstellzeitraum durch die [X.] angezeigt werden.

Der sinngemäße Einwand der Beklagten, das [X.] werde von der Basisstation 16 und nicht vom Computer 12 ausgegeben, zudem werde es nicht innerhalb des [X.] ausgegeben, sondern bereits bevor das [X.] vom Computer 12 empfangen worden sei, und insbesondere auch dann ausgegeben, falls das [X.] im Fehlerfall den Computer 12 überhaupt nicht erreiche, führt zu keiner anderen Beurteilung als vorstehend gegeben. Denn der Anspruch 1 des [X.] fordert nicht, dass die [X.] der [X.] die [X.] ausgibt, vielmehr sind [X.] der [X.] dafür eingerichtet, die [X.] zu veranlassen, den gleichen Inhalt wie die [X.] während des [X.] als Ton auszugeben (Merkmale 1.4, 1.4.2). Die in der Schrift [X.] 5 offenbarte Basisstation 16 und die Audioprozessoreinheit 64 des Mobilteils 18 stellen ein solches [X.] und eine [X.] der [X.] dar. Zudem wird das [X.] gemäß der Schrift [X.] 5 im Schritt 104 von dem Eingabegerät 14 zum Computer 12 übertragen (Spalte 5, Zeilen 56, 57) und erst im darauffolgenden Schritt 106 erzeugt die Basisstation 16 ein [X.] und sendet es an das Mobilteil 18 (Spalte 5, Zeilen 64-67). Mangels anderer Angaben geht der Fachmann davon aus, dass die Übertragung des [X.]s über die [X.]-Verbindung an den Computer 12 im [X.] regelmäßig mit dem Schritt 104 abgeschlossen ist, wenn im darauffolgenden Schritt 106 das [X.] am Eingabegerät 14 ausgegeben wird. Die Schrift [X.] 5 ist insbesondere nicht auf die Lehre reduziert, das [X.] auszugeben, um einen Verbindungsaufbau zu dem Computer 12 zu versuchen. Vielmehr hat das [X.] auch die Funktion, dem Computer anzuzeigen, dass der Nutzer Sprachanweisungen eingeben möchte (Spalte 5, Zeilen 59-66), und den Computer zu veranlassen, das [X.] auf den Empfang nachfolgender Sprachanweisungen vorzubereiten (Spalte 6, Zeilen 22-39). Dass die [X.] 5 auch den Fehlerfall beschreibt, in dem das [X.] diese Funktion nicht erfüllen kann, und es bei dem Versuch eines Verbindungsaufbaus bleibt, ändert nichts an dem weiteren Offenbarungsgehalt der [X.] 5.

Zweifelsfrei gibt die Audionachricht „Bitte warten“ dem Nutzer eine Handlungsanleitung, nämlich zu warten. Dass diese Handlungsanleitung auch im Fehlerfall ausgegeben wird, bevor sie durch ein Computer-Fehlersignal (computer error signal) abgelöst wird, (Spalte 6, Zeilen 9-19) kann dahinstehen, denn das [X.] wird im [X.] solange an den Nutzer übertragen, bis der Computer 12 voll funktionsfähig geworden ist (Spalte 6, Zeilen 6-8). Erst mit dem Verarbeitungsschritt 114 (Figur 4) ist der Computer 12 voll funktionsfähig, denn dann sind das System und insbesondere das [X.] des [X.] bereit, Sprachanweisungen vom Nutzer anzunehmen (Spalte 6, Zeilen 33-38).

2.2 Der Gegenstand des Anspruchs 1 ist gegenüber der [X.] gemäß der Druckschrift [X.] 5,864,815 A (= [X.] 6) neu.

a) Die [X.] 6 möchte visuelle Rückmeldungen eines, in einem Windows-95-Computersystem integrierten, Spracherkennungssystems liefern, ohne größere Teile des Bildschirms für längere [X.] zu blockieren (Spalte 1, Zeilen 17-37).

Hierzu wird der aktuelle Zustand bzw. Status (listening, not listening, [X.]) des Spracherkennungssystems als Icon in einem bestimmten Bereich einer Taskleiste angezeigt (Figur 2). Zusätzlich wird für einige Sekunden ein [X.] („tool tip“; [X.]) angezeigt, wenn der Nutzer die Computermaus über dem [X.] platziert (Figur 3; Spalte 3, Zeilen 21 bis Spalte 4, Zeilen 45). Nach einem nutzerinitiierten Zustandswechsel des Spracherkennungssystems ändert sich das [X.] und ein entsprechender [X.] (Not listening, listening, [X.]) wird angezeigt (Figuren [X.], [X.], [X.]). Nach einer Spracheingabe im Zustand „listening“ wird anstelle des [X.]s ein Icon angezeigt, dass die Verarbeitung der Audio-Eingabe symbolisiert (Figur 8: Sanduhr 68) und ein [X.] eingeblendet, der dem Nutzer eine Rückmeldung über den erfolgreichen [X.] liefert (Figur 8: Heard 70). Im Falle einer misslungenen Spracheingabe werden ein entsprechendes Icon (Figur 9: Fragezeichen 72) und [X.] (Figur 9: Not recognized) angezeigt, wie dies in den nachfolgend eingeblendeten Figuren 2, 3, [X.], [X.], [X.], 8 und 9 dargestellt ist:

Abbildung

[X.] 6, Figur 2, mit Kommentierung durch den Senat

Abbildung

Wenn der Benutzer den Status des Spracherkennungssystems wechseln möchte, klickt er mit [X.] auf das [X.], wählt in dem sich öffnenden Menü den Punkt Set Listening Mode und anschließend in einem Untermenü den gewünschten Zustand (Start Listening, Standby, Stop Listening):

Abbildung

[X.] 6, Ausschnitt aus Figur 7

Wenn eine Sprachsignaleingabe erfolgreich verarbeitet wurde, erfolgt eine Rückmeldung an den Benutzer (Spalte 6, Zeilen 5-7). Die nachfolgend eingeblendete Figur 12 zeigt diese visuelle Rückmeldung für den Fall des erfolgreichen Erkennens der Spracheingabe „[X.]?“, nämlich die Auflistung der möglichen Sprachbefehle:

Abbildung

[X.] 6, Figur 12 mit Kommentierung durch den Senat

b) Die Schrift [X.] 6 zeigt somit eine [X.] (Figur 1: computer system 10, voice facility 28, [X.]) gemäß Merkmal 1, mit einer [X.] gemäß Merkmal 1.1 zum Ausführen eines [X.]es des Erkennens der Sprache des Nutzers (Spalte 3, Zeilen 43-47: [X.]), einem [X.] gemäß Merkmal 1.1.2 zum Empfangen von [X.] von einem Nutzer und zum Anweisen der [X.], den [X.] zu beginnen (Da der Benutzer, wie dargelegt, über das Eingabemittel [X.] die [X.] in den listening-Zustand schalten kann, stellt die [X.] 22 und das Betriebssystem 26 ein [X.] dar, welches Startanweisungen an die [X.] liefert.), einem Anzeigemittel gemäß Merkmal 1.1.3 (Figur 1: video display 20) zum Anzeigen mindestens eines von erkennbaren Sprachtexten der [X.] (Spalte 6, Zeilen 14, 15: [X.]; Figur 12) und einer [X.] gemäß Merkmal 1.1.4 (Figur 1: [X.]; Spalte 3, Zeile 34: sound board), wobei die [X.] gemäß Merkmal 1.2 des Weiteren ein [X.] umfasst (Figur 1: [X.] 12, operating system 26).

Der Fachmann kann der [X.] 6 keinen Einstellzeitraum im Sinne der Merkmale 1.3 und 1.3.1 entnehmen, während dem das Anzeigen eines [X.], des mindestens einen von erkennbaren Sprachtexten und einer [X.] zu beginnen ist (Merkmale 1.4 bis [X.]), bzw. gemäß Merkmal 1.4.3 das Verbotszeichen gelöscht wird. Die Schrift [X.] 6 offenbart auch nicht, dass die [X.] zu veranlassen ist, den gleichen Inhalt wie eine [X.] während des [X.] als Ton auszugeben (Merkmal 1.4.2).

c) Zwar mag der nutzerinitiierte Wechsel des Zustands der [X.] (Figur 7) von „not listening“ zu „listening“ mit einer technisch bedingten Verzögerung verbunden sein. Der [X.] 6 lässt sich jedoch nicht unmittelbar und eindeutig entnehmen, ob das [X.], das den „not listening“-Zustand anzeigt, zunächst im Sinne eines [X.] stehen bleibt oder sofort umgeschaltet wird und den „listening“-Zustand anzeigt. Es spricht viel für die zweite Variante, denn anderenfalls würde der Nutzer – aufgrund der [X.] des Systems auf seine Bedienung – von einer Fehlbedienung und/oder Fehlfunktion ausgehen. Aufgrund dieses anderen [X.]ablaufs sind die in [X.] 6 offenbarten [X.] keine Verbotszeichen gemäß den Merkmalen 1.4.1a und 1.4.3.

Jedenfalls wird in dem [X.]raum der Umschaltung, unterstellt er wäre so lang, dass ein Nutzer ihn wahrnehmen könnte, weder ein erkennbarer Sprachtext noch eine [X.] angezeigt. Denn die Liste mit erkennbaren Sprachtexten erscheint nur dann, wenn sie – wie einleitend dargelegt – über den Sprachbefehl „[X.]?“ angefordert wird (Figur 12). Zur Erkennung dieses Anforderungsbefehls muss sich die [X.] jedoch schon im „listening“-Zustand befinden, d. h. das Anzeigen des Textes beginnt entgegen der Auslegung der Forderung im Merkmal 1.4.1b nicht während des [X.]. Die Angaben „Not listening" (dt. Übersetzung: „Es wird nicht zugehört"), und „Listening" (dt. Übersetzung: „Es wird zugehört") sind Zustandsangaben des Systems und stellen keine Handlungsanleitung für den Benutzer dar (Merkmal [X.]).

Den von der Klägerin skizzierten Ablauf „Listening – Anzeige der Liste durch den Sprachbefehl „[X.]?“ – Umschaltung zu „Not Listening“ (Listenanzeige bliebe bestehen) – Umschaltung zu „Listening“ (mit Einstellzeitraum, Listenanzeige bliebe weiterhin bestehen)“ kann der Fachmann der [X.] 6 nicht unmittelbar und eindeutig entnehmen. Insbesondere spricht viel dafür, dass das Fenster 82 mit der Liste (Figur 12) spätestens dann geschlossen wird, wenn der Nutzer mit [X.] einen Zustandswechsel einleitet (Figur 7), denn die [X.] 6 möchte – wie einleitend dargelegt – ein Spracherkennungssystem schaffen, dessen Anzeigen möglichst wenig Platz auf dem Bildschirm des Computersystems beanspruchen.

Zudem würden in diesem Szenario sowohl das „Verbotszeichen“, also das „Not listening“-Icon, als auch die Liste mit den erkennbaren Sprachtexten schon vor Beginn des „[X.]“ angezeigt, also nicht erst durch an die [X.] gerichtete Anweisungen veranlasst, was nach der Auslegung des Senats nicht unter den Anspruchswortlaut fällt.

2.3 Der Gegenstand des Anspruchs 1 ist gegenüber der [X.] gemäß der Druckschrift [X.] 2003/0095212 [X.] (= [X.] 7) neu.

a) Die Schrift [X.] 7 möchte tasten- und sprachgesteuerte Fernsteuerungen für Haushaltsgeräte, wie Fernseher oder Videorecorder, so weiterentwickeln, dass trotz eines einfachen Aufbaus der Fernsteuerung und des Haushaltsgeräts eine Vielzahl unterschiedlicher Befehle übertragen werden kann und der Nutzer über ein [X.] (graphical user interface) des ferngesteuerten Haushaltsgeräts eine optische Rückmeldung hinsichtlich seiner Sprachbefehle erhält (Absätze 0001-0023).

Als Lösung zeigt die [X.] 7 eine [X.] (10), der sowohl über Tasten (1, 1a) als auch über Sprachbefehle (V) gesteuert wird. Die entsprechenden [X.] ([X.], [X.]) werden von [X.] (21, 31) eines Fernsehers (20) empfangen. Auf dessen Bildschirm ([X.]) werden dem Nutzer in einem [X.] ([X.]) Texte ([X.]) und graphische Symbole (IM) angezeigt, die ihm insbesondere eine Rückmeldung über die eingegebenen Sprachbefehle geben, vgl. die nachfolgend eingeblendete Figur 1 [X.] den Absätzen 0077 und 0078:

Abbildung

[X.] 7, Figur 1 mit Kommentierung und Kolorierung durch den Senat

Die Figur 3 der [X.] 7 zeigt ein Blockschaltbild der Empfänger- und Auswerteschaltungen in dem Fernseher (20):

Abbildung

[X.] 7, Figur 3 mit Kommentierung und Kolorierung durch den Senat

b) Die Schrift [X.] 7 zeigt somit eine [X.] gemäß Merkmal 1 (Figuren 1, 3, Absätze 0077, 0078: [X.], [X.]) mit einer [X.] gemäß Merkmal 1.1 zum Ausführen eines [X.]es des Erkennens der Sprache des Nutzers (voice recognition section 34, dictionary 35), einem [X.] gemäß Merkmal 1.1.2 zum Empfangen von [X.] von einem Nutzer und zum Anweisen der [X.], den [X.] zu beginnen (talk [X.], [X.], carrier detector 33), einem Anzeigemittel gemäß einem Teil des Merkmals 1.1.3 (TV screen [X.], voice recognition panel [X.], [X.]) und einer [X.] gemäß Merkmal 1.1.4 (mitzulesen auf Grund Absatz 0002: television (TV) sets), wobei die [X.] des Weiteren ein [X.] (112) gemäß Merkmal 1.2 umfasst (device controller 25).

Der Fachmann kann der [X.] 7 zwar entnehmen, dass auf dem Bildschirm ([X.]) im [X.] ([X.]) aus der erkannten Sprache des Benutzers abgeleitete Informationstexte sowie Anweisungen und Fehlermeldungen angezeigt werden (Figur 26, Schritt [X.]; Absätze 0138, 0175, Tabelle 2). Einen Überblick über die anzeigbaren Texte und Symbole (pattern) liefern die Tabellen 1 bis 4 und die Figur 9, die nachfolgend vollständig bzw. ausschnittsweise wiedergegeben sind:

Abbildung

[X.] 7, Absätze 0173, 0175, Tabelle 1 (Ausschnitt), Tabelle 2 mit Kolorierungen durch den Senat

Abbildung

[X.] 7, Absätze 0178, 0181, Tabelle 3, 4 mit Kolorierungen durch den Senat

Abbildung

[X.] 7, Figur 9

Weder der „Normalbetrieb“ noch eine [X.] oder der „[X.]“ der in der Schrift [X.] 7 beschriebenen Vorrichtung offenbaren jedoch einen Einstellzeitraum im Sinne der Merkmale 1.3 und 1.3.1 während dem das Anzeigen eines [X.], des mindestens einen von erkennbaren Sprachtexten und einer [X.] zu beginnen ist (Merkmale 1.4 bis [X.]), bzw. gemäß Merkmal 1.4.3 das Verbotszeichen gelöscht wird. Die Schrift [X.] 7 offenbart auch nicht, dass die [X.] zu veranlassen ist, den gleichen Inhalt wie eine [X.] während des [X.] als Ton auszugeben (Merkmal 1.4.2).

c) Um eine Spracheingabe zu starten (und während der gesamten Spracheingabe), drückt der Benutzer die [X.] 8 an der Fernbedienung 10, die daraufhin ein [X.] aussendet. Der IR-Empfänger 30 empfängt dieses Signal [X.]; seine Schaltungen 32, 33 weisen die [X.] 34 an, die Spracherkennung zu starten. Zudem wird die Steuerungseinheit 25 angewiesen, die Anzeige des Textes „[X.]“ und eine bestimmte Symbolfolge (Figur 9: Pattern 1) zu veranlassen, die den Nutzer zum Sprechen auffordert (Figuren 1, 4, 6, 9; Absätze 0078, 0084-0088, 0093-0112, 0126-0145, 0171-0179). Damit entnimmt der Fachmann diesem „Normalbetrieb“ der [X.] 7 zwar möglicherweise eine technisch bedingte Verzögerung, es ist jedoch fraglich, ob diese im Sinne der vorstehenden Auslegung des [X.] gemäß Merkmal 1.3 überhaupt lange genug andauert. Jedenfalls wird während dieses [X.]raums weder ein Verbotszeichen noch eine Liste mit erkennungsfähigen Wörtern oder eine [X.] gemäß den Merkmalen 1.4.1a bis [X.] angezeigt.

d) In der [X.], in der die Sprach-[X.] den [X.] abbricht (Absatz 0181: [X.], Tabelle 4, Zeile: [X.]) stellt weder der Text „Please speak again“ (Absatz 0175, Tabelle 2: Text 12) ein Verbotszeichen dar, noch wird in dieser Situation mindestens einer von erkennbaren Sprachtexten angezeigt. Damit zeigt diese [X.] jedenfalls nicht die Merkmale 1.3 bis 1.4.3.

e) Der „[X.]“ (Absatz 0178, Tabelle 4, Zeile microphone test; Absätze 0184-0186), der – bei einsatzbereiter [X.] 34 – mittels des Sprachbefehls Microphone test gestartet wird, dient der Anpassung der [X.] 34 an die Spracheigenschaften des Benutzers. Während des [X.]s wird der Text [X.]. [X.] und das Pattern 4 (Figur 9) angezeigt. Nach erfolgreicher Durchführung heißt es Adjustment is done und Pattern 5 (Figur 9) informiert den Benutzer über ggfs. veränderte Parameter (Absatz 0175, Tabelle 2: Texte 15, 16; Absatz 0184). Während des Abspeicherns der Parameter wird kein Text, sondern nur noch das Pattern 5 angezeigt (Absätze 0185 und 0173, Tabelle 1, Zeilen Start/End parameter transfer … Pattern 5 None). Um nach abgeschlossenem [X.] einen Sprachbefehl eingeben zu können, muss der Benutzer die [X.] 8 erneut drücken und der bereits beschriebene „Normalbetrieb“ beginnt. Somit zeigt der [X.] der [X.] 7 schon keinen Einstellzeitraum gemäß Merkmal 1.3, denn zum einen analysiert die [X.] 34 während des Tests die vom Benutzer gesprochen Worte „Microphone test“, führt also bereits eine Spracherkennung durch, zum anderen ist sie, wie dargelegt, nach Ablauf des [X.]s nicht bereit, den [X.] auszuführen. Zudem werden während des [X.]s keine erkennungsfähigen Wörter gemäß Merkmal 1.4.1.b angezeigt, denn die Anzeige der Pattern 4 bzw. 5 mit den darin enthaltenen Texten „Microphone Test“ und „Formant Level“ (Figur 9) dient ersichtlich nicht dazu, den Benutzer über die erkennungsfähigen Sprachtexte zu informieren.

Ob der Fachmann aus den Absätzen 0055 und 0199 entnimmt, dass auch ein erkennbarer Sprachtext (candidates for the objects of voice recognition; the candidates) anzeigbar ist ([X.] 1.3.1), kann somit dahinstehen, denn jedenfalls würde eine solche Anzeige nicht in einem Einstellzeitraum gemäß den Merkmalen 1.3 und 1.4.1b beginnen.

3. Der Gegenstand des Anspruchs 1 beruht auch auf einer erfinderischen Tätigkeit.

3.1 Ausgehend vom Stand der Technik nach der Schrift [X.] 5 kommt der Fachmann nicht in naheliegender Weise zum Gegenstand des Anspruchs 1.

a) Der Fachmann mag zwar Veranlassung haben, während des [X.] auf dem Anzeigemittel mit dem Anzeigen eines [X.] und der [X.] zu beginnen (Merkmale 1.4.1, 1.4.1a, [X.], [X.] 1.4.2).

Denn falls der Fachmann beim Nacharbeiten der Lehre aus der [X.] 5 eine Häufung von Fehlbedienungen durch den Nutzer feststellt, etwa weil der Nutzer mit [X.] bereits zu einem [X.]punkt beginnt, zu dem der Computer noch nicht zur Spracherkennung bereit ist, steht der Fachmann vor der Aufgabe, die dort beschriebene Mensch-Maschine-Schnittstelle zu verbessern. Zu den fachüblichen Maßnahmen zur Verringerung von Fehleingaben gehört, dass dem Nutzer über die vorhandenen Ausgabemittel des Eingabegeräts wie Lautsprecher 66 (Figur [X.]) und Bildschirm (Spalte 7, Zeile 37) Anweisungen mit übereinstimmenden Bedeutungsinhalt und auch in Zeichensprache gegeben werden, etwa durch ein Sinnbild. So gibt bereits die Schrift [X.] 5 den Hinweis, dass zusätzlich oder anstelle eines akustischen Tons und der Audionachricht „Spracherkennung bereit“, die anzeigt, dass die [X.] zur Spracherkennung bereit ist, andere Arten von Anzeigen verwendet werden, beispielsweise eine Flüssigkristallanzeige (LCD) an der Eingabevorrichtung 14, um Symbole oder Text anzuzeigen, die diesem Signal entsprechen (Spalte 7, Zeile 30-39). Nicht anderes wird der Fachmann für die Audionachricht „Bitte warten“ vorsehen.

b) Eine Veranlassung des Fachmanns, zusätzlich zur Anzeige des [X.] (Merkmal 1.4.1a) bereits während des [X.] mit dem Anzeigen des mindestens einen von erkennbaren Sprachtexten zu beginnen (Merkmal 1.4.1b), kann der Senat jedoch nicht erkennen.

Wie zur Auslegung dargelegt, handelt es sich bei der Anzeige mindestens eines von erkennbaren Sprachtexten (Merkmal 1.4.1b), begleitet von einem Verbotszeichen (Merkmal 1.4.1a), um ein Mittel, das ein technisches Problem mit technischen Mitteln löst und daher bei der Prüfung auf Patentfähigkeit zu berücksichtigen ist.

Die Anzeige von erkennbaren Sprachtexten mag dann fachüblich sein, falls die [X.] zur Spracheingabe bereit ist (vgl. [X.] 6, Spalte 6, Zeilen 7-18: [X.]. 12 shows an example wherein the voice command "[X.]?" is properly recognized. [X.] is opened that provides a [X.]; [X.] 14, Seite 21, vorletzter Absatz: displays a small selection of useful commands that Dragon NaturallySpeaking recognizes for the current context). Der Fachmann hat jedoch keine Veranlassung, mit dem Anzeigen von Sprachtexten bereits während des [X.] zu beginnen (Merkmal 1.4.1b), wenn die [X.] noch gar nicht zur Ausführung des [X.]es bereit ist (Merkmal 1.3). Denn die [X.] 5 möchte mit der [X.] „Bitte warten“ eine Spracheingabe des Benutzers gerade verhindern. Die Anzeige eines erst zu einem späteren [X.]punkt erkennbaren [X.] birgt jedoch die Gefahr, dass der Benutzer sich zum Sprechen animiert fühlt, d. h. die Anzeige der Sprachtexte als Aufforderung zum Sprechen versteht.

c) Auf das verbleibende Unterschiedsmerkmal 1.4.3 kommt es nicht mehr an.

d) Soweit das Streitpatent von dem Problem ausgeht, dass sich ein Benutzer auf eine Liste von Sprachtexten konzentriert, selbst wenn ein Bild mit einer Bewegung oder dergleichen in einem vorbestimmten Bereich des Bildschirms angezeigt wird, so dass es für den Benutzer schwierig ist, den [X.]punkt zu erkennen, zu dem er eine Spracheingabe machen soll (Absatz 0010), so enthält diese Problembeschreibung offensichtlich bereits Lösungselemente, einen entsprechenden Stand der Technik hat die Klägerin jedenfalls nicht nachgewiesen.

3.2 Aus vergleichbaren Gründen kommt der Fachmann ausgehend vom Stand der Technik nach den Schriften [X.] 6 oder [X.] 7 nicht in naheliegender Weise zum Gegenstand des Anspruchs 1.

4. Die Gegenstände der Ansprüchen 2 bis 4 erweisen sich als neu und auf einer erfinderischen Tätigkeit beruhend. Die vorstehenden Überlegungen gelten sinngemäß.

III.

Die Kostenentscheidung basiert auf § 84 Abs. 2 [X.] [X.] § 91 Abs. 1 ZPO.

Die Entscheidung über die vorläufige Vollstreckbarkeit folgt aus § 99 Abs. 1 [X.] [X.] § 709 S. 1 und S. 2 ZPO.

Meta

4 Ni 3/21 (EP)

26.05.2021

Bundespatentgericht 4. Senat

Urteil

Sachgebiet: Ni

nachgehend BGH, 11. Januar 2024, Az: X ZR 68/21, Urteil

Art II § 6 Abs 1 Nr 1 IntPatÜbkG, Art II § 6 Abs 1 Nr 3 IntPatÜbkG, Art 138 Abs 1 Buchst a EuPatÜbk, Art 138 Abs 1 Buchst c EuPatÜbk, Art 54 EuPatÜbk, Art 56 EuPatÜbk

Zitier­vorschlag: Bundespatentgericht, Urteil vom 26.05.2021, Az. 4 Ni 3/21 (EP) (REWIS RS 2021, 5529)

Papier­fundstellen: REWIS RS 2021, 5529


Verfahrensgang

Der Verfahrensgang wurde anhand in unserer Datenbank vorhandener Rechtsprechung automatisch erkannt. Möglicherweise ist er unvollständig.

Az. 4 Ni 3/21 (EP)

Bundespatentgericht, 4 Ni 3/21 (EP), 26.05.2021.


Az. X ZR 68/21

Bundesgerichtshof, X ZR 68/21, 11.01.2024.


Auf dem Handy öffnen Auf Mobilgerät öffnen.


Die hier dargestellten Entscheidungen sind möglicherweise nicht rechtskräftig oder wurden bereits in höheren Instanzen abgeändert.

Ähnliche Entscheidungen

X ZR 68/21 (Bundesgerichtshof)


4 Ni 4/21 (EP) (Bundespatentgericht)

Patentnichtigkeitsklageverfahren – "Spracherkennungsvorrichtung (europäisches Patent)" – Bei der Anzeige von Wörtern und Zeichen auf dem …


X ZR 73/21 (Bundesgerichtshof)


17 W (pat) 124/08 (Bundespatentgericht)

Patentbeschwerdeverfahren – „Verfahren und Vorrichtung zur Unterstützung der Befehls- und Dateneingabe in Kraftfahrzeugen“ – zur …


6 Ni 20/18 (EP) (Bundespatentgericht)

Patentnichtigkeitssache – "Verfahren und Einrichtung zur Kommunikationskanalauswahl" – erfinderische Tätigkeit


Referenzen
Wird zitiert von

Keine Referenz gefunden.

Zitiert

X ZR 144/17

X ZR 110/13

Zitieren mit Quelle:
x

Schnellsuche

Suchen Sie z.B.: "13 BGB" oder "I ZR 228/19". Die Suche ist auf schnelles Navigieren optimiert. Erstes Ergebnis mit Enter aufrufen.
Für die Volltextsuche in Urteilen klicken Sie bitte hier.