BT-Drucksache 17/14798

Maschinelle Sprachverarbeitung und forensische Phonetik bei Polizei und Geheimdiensten

Vom 23. September 2013


Deutscher Bundestag Drucksache 17/14798
17. Wahlperiode 23. 09. 2013

Kleine Anfrage
der Abgeordneten Andrej Hunko, Jan Korte, Wolfgang Gehrcke, Herbert Behrens,
Sevim Dag˘delen, Annette Groth, Ulla Jelpke, Harald Koch, Niema Movassat,
Thomas Nord, Dr. Petra Sitte und der Fraktion DIE LINKE.

Maschinelle Sprachverarbeitung und forensische Phonetik bei Polizei und
Geheimdiensten

In verschiedenen Bereichen kommt bei Polizeien und Geheimdiensten die
maschinelle Sprachverarbeitung zum Einsatz. Hierzu gehören das Erkennen ro-
her Inhalte, die automatische Sprachenerkennung bzw. die Vorselektion nach
Sprachen, die Fähigkeit zur Verarbeitung (kontinuierlich) gesprochener Spra-
che sowie die Umwandlung gesprochener in geschriebene Sprache. Derart kön-
nen die Sprachdaten weiter durch Verfahren zu Texterkennung, Textfilterung,
Textmining oder der maschinellen Übersetzung verarbeitet werden. Behörden
des Bundesnutzen aber auch Anwendungen zur forensischen Phonetik. Das
Bundeskriminalamt (BKA) setzt beispielsweise die Stimmenanalyse ein, um
Audioaufzeichnungen zu analysieren. Eine Software versucht ein Stimmenpro-
fil einzelner Personen über vorgefundene Merkmale auszulesen. Die Merk-
malskonfigurationen können in einer Stimmenvergleichsanalyse mit anderen
Aufzeichnungen abgeglichen werden. Über das „lautsprachliche Verhalten“
sollen Aussagen über Alter und Geschlecht des Sprechers getroffen werden.
Das BKA nutzt die Anwendungen, um bei einem Betroffenen „seine regionale
Herkunft, seine Sprachkompetenz bzw. seine soziale Zugehörigkeit, eine even-
tuell vorhandene Stimmverstellung sowie Einflüsse von z. B. Stress, Alkohol
oder akuten Stimmerkrankungen“ zu bestimmen (http://tinyurl.com). Analy-
siert werden Stimme, Sprache und Sprechweise. Die Software ist in der Lage,
unerwünschte Nebengeräusche auszufiltern. Mit der sogenannten „maschinel-
len Sprechererkennung“ soll die Zuverlässigkeit eines Stimmenvergleichs er-
höht werden. Im BKA kommt hierfür ein „Sprecherkennungssystem“ (SPES)
zum Einsatz, das einen „Ähnlichkeitswert“ berechnet. Mit der „phonetischen
Textanalyse“ werden Audioaufzeichnungen verschriftlicht, überprüft und eben-
falls analysiert und bewertet. Auch Hintergrundgeräusche werden derart be-
stimmt.

Auch Geheimdienste nutzen Technologien, um Sprachdaten zu analysieren und
auszuwerten. Vor 13 Jahren wurde offenkundig, wie der Bundesnachrichten-
dienst (BND) Unternehmen mit entsprechendem Wissen aufzukaufen versuchte.

Laut dem Nachrichtenmagazin „FAKT“ habe der deutsche Geheimdienst im
Wettbewerb mit amerikanischen Partnern gestanden, um die Vorherrschaft in
dem Bereich zu erlangen (ARD, 3. September 2013). Unter den vom BND auf-
gekauften Firmen soll eine Firma des heutigen Professors A. W. vom Karlsruher
Institut für Technologie (KIT) gewesen sein. Bis 2002 habe A. W. an Projekten
gearbeitet, die in das US-Programm „Total Information Awareness“ integriert
worden seien. Das Nachrichtenmagazin „FAKT“ verfügt nach eigenen Aus-

Drucksache 17/14798 – 2 – Deutscher Bundestag – 17. Wahlperiode

sagen über „Unterlagen”, die belegten, dass in einem der Projekte der Militär-
geheimdienst NSA als Kunde benannt würde. Die Europäische Kommission
hatte in den Jahren zuvor mit AVENTINUS und SENSUS Projekte gefördert,
um ebenfalls entsprechende Technologien für das damalige Polizeiamt bzw. die
spätere Polizeiagentur EUROPOL zu entwickeln. Der Projektkoordinator für
SENSUS war mit S. B. (Tarnname) ein BND-Angehöriger, der für das „Amt für
Auslandsfragen“ (AfA), ein Tarninstitut des BND, arbeitete („Die Bayern-Bel-
gien-Connection“; www.heise.de). Die Zugehörigkeit des AfA zum BND ist der
Europäischen Kommission laut Medienberichten von Anfang an bekannt ge-
wesen. Der BND sei sogar von sich aus an die Kommission herangetreten, um
SENSUS auf den Weg zu bringen. Die Bundesregierung erklärte hierzu, der
BND sei in SENSUS als „gewöhnlicher Dritter“ beteiligt gewesen (Bundestags-
drucksache 14/6667). S. B. wurde später unter seinem richtigen Namen C. K.
wegen Fälschung eines Vertrages zuungunsten der Firma P. im SENSUS-Projekt
verurteilt.

Die Marktführerschaft wurde in jenen Jahren der belgischen Firma L. & H. zu-
geschrieben, die damals mehrere Tausend Mitarbeiter/-innen beschäftigte. Das
Nachrichtenmagazin „FAKT“ berichtet, auch L. & H. habe im Jahr 2000 eine
Firma von A. W. „mit dessen Know-How“ gekauft. Dieses sei dann für den
deutschen Bundesnachrichtendienst weiterentwickelt worden. Auch das Polizei-
amt EUROPOL hatte mit dem BND hinsichtlich der Spracherkennung zusam-
mengearbeitet. Im Rahmen einer Marktbeobachtung von Übersetzungssoftware
nahmen vier EUROPOL-Mitarbeiter/-innen an einer Veranstaltung teil, die vom
BND durchgeführt wurde. Die Bundesregierung vertritt die Auffassung, dabei
sei das Trennungsgebot von Polizei und Diensten unberührt geblieben.

Mittlerweile werden Spracherkennungssysteme auch in polizeiliche und ge-
heimdienstliche Analysesoftware integriert. Die Firma r. S. S. bewirbt sein Sys-
tem „INT-CENT“ damit, dass als Addon auch die Spracherkennung hinzuge-
kauft werden könne. Laut Eigenwerbung bringt die Anwendung als Feature die
„Automatische Übersetzung” mit (http://tinyurl.com). Zu den Kunden von
r. S. S. gehören Behörden des Bundesministeriums des Innern und des Bundes-
kanzleramts.

Auch zur Analyse der „strategischen Fernmeldeaufklärung“ des BND dürften
computergestützte Spracherkennungssysteme zum Einsatz kommen. Mit-
schnitte werden vor ihrer Weitergabe an ausländische Dienste „G10-bereinigt“,
also beteiligte deutsche Partner oder auch Gesprächsbeiträge entfernt. Dies
dürfte kaum händisch vorgenommen werden. Zu vermuten ist, dass auch der in
Echtzeit überwachte Verkehr durchforstet wird, um einzelne Sprecher/-innen
identifizieren zu können und Gespräche aufzuzeichnen und auszuwerten. Eine
Software muss hierfür nicht nur die Fähigkeit zur Stimmanalyse mitbringen,
sondern auch die gesprochenen Sprachen erkennen.

Wir fragen die Bundesregierung:

1. Welche Behörden des Bundesministeriums des Innern, des Bundesministe-
riums der Verteidigung und des Bundeskanzleramts nutzen Systeme zur
maschinellen Sprachverarbeitung oder forensischen Phonetik, und worum
handelt es sich dabei?

2. Welche weitere Hard- und Software kommt zum Erkennen roher Inhalte, zur
automatischen Sprachenerkennung bzw. die Vorselektion nach Sprachen,
zur Verarbeitung (kontinuierlich) gesprochener Sprache sowie zur Umwand-
lung gesprochener in geschriebene Sprache zur Anwendung?

3. Welche weitere Hard- und Software kommt für Verfahren zur Texterken-

nung und Textfilterung, zum Textmining oder der maschinellen Übersetzung
zum Einsatz?

Deutscher Bundestag – 17. Wahlperiode – 3 – Drucksache 17/14798

4. Welche der genutzten Hard- oder Software ist dabei in der Lage, Sprachen
zu erkennen oder Features zur automatisierten Übersetzung zu integrieren?

5. In welchen Abteilungen der Behörden kommen die Anwendungen zum
Einsatz?

6. Wofür wird diese dort genutzt?

7. Wer hat die oben erfragte Hard- und Software hergestellt bzw. program-
miert und an die Behörden verkauft?

8. Welche Kosten entstanden hierfür in den letzten zehn Jahren?

9. In welchen Fällen wurde entsprechende Software von welchen ausländi-
schen Behörden überlassen oder verkauft?

10. Inwiefern und mit welchen Funktionalitäten wurden die Anwendungen von
den Behörden weiterentwickelt oder sogar selbst programmiert?

11. Hinsichtlich welcher Anwendungen ist den Behörden der zugrundelie-
gende Quellcode bekannt?

12. Über welche Funktionalitäten oder Zusatzmodule verfügen die Anwendun-
gen?

13. Auf welche Datenbanken, Sprachverkehre, Ermittlungsergebnisse oder
sonstigen Datensätze greifen die Anwendungen bei den Behörden jeweils
zu?

14. Inwiefern ist es möglich, in polizeilichen oder geheimdienstlichen Daten-
banken nach einzelnen Stimmen oder Audioaufzeichnungen zu suchen,
und in welchem Umfang wird dies praktiziert (bitte, soweit möglich, Zah-
len seit 2007 angeben)?

15. Auf welche Art und Weise kann eine von den Behörden genutzte Software
zur Stimmenanalyse, Stimmenvergleichsanalyse oder Sprechererkennung
Aussagen über Alter und Geschlecht, „regionale Herkunft“, „Sprachkom-
petenz“, „soziale Zugehörigkeit“, Stimmverstellung, Stimmerkrankungen
treffen, und als wie wahrscheinlich wird diese bewertet?

16. Welche Behörden des Bundesinnenministeriums, des Bundesverteidi-
gungsministeriums und des Bundeskanzleramts nutzen gegenwärtig wel-
che Software der Firma r. S. S., und inwiefern sind dort die Spracherken-
nung oder Module zur „Automatischen Übersetzung“ integriert?

17. Inwiefern wird auch die „strategische Fernmeldeaufklärung“ des BND mit
maschineller Sprachverarbeitung oder forensischer Phonetik vorgenom-
men?

18. Mit welchen Anwendungen und welchen Funktionalitäten können vom
BND Sprachverkehre in Echtzeit ausgeforscht werden, und in welchem
Umfang wird dies praktiziert?

19. In welchen Fällen wird dies praktiziert (bitte hierfür nicht nur auf die recht-
liche Grundlage des BND verweisen, sondern darstellen, ob dies für beson-
dere Einsätze vorgesehen ist)?

20. Inwiefern können dadurch einzelne Sprecher/-innen identifiziert werden?

21. Inwiefern und mit welchen Funktionalitäten werden abgehörte Sprachver-
kehre mittels maschineller Sprachverarbeitung oder forensischer Phonetik
„G10-bereinigt“?

22. Inwiefern trifft es zu, dass der BND 1996 und 1997 die „Erfassung von
Sprachverkehren [...] aus technischen Gründen für die nächste Zeit auf

Ausnahmefälle beschränkt[e]“, und welche Gründe waren hierfür maßgeb-
lich (http://tinyurl.com)?

Drucksache 17/14798 – 4 – Deutscher Bundestag – 17. Wahlperiode

23. Inwiefern trifft es zu, dass der BND mit dem „Amt für Auslandsfragen“ ein
Tarninstitut gründete, um in den Besitz entsprechender Technologie zur
maschinellen Sprachverarbeitung oder sonstiger Auswertung audiobasier-
ter Datensätze zu gelangen?

24. Sofern die Bundesregierung die Auffassung vertritt, das „Amt für Aus-
landsfragen“ sei kein Tarninstitut des BND, inwiefern arbeitete der Ge-
heimdienst dennoch mit dem „Amt für Auslandsfragen“ zusammen?

25. Welche Technologien zur maschinellen Sprachverarbeitung waren für den
BND in den letzten 15 Jahren von besonderem Interesse?

26. Inwiefern trifft es zu, dass der BND oder andere Geheimdienste des Bun-
des oder von ihm beauftragte oder gegründete Firmen oder Einrichtungen
hierzu in den letzten 15 Jahren andere Unternehmen mit entsprechendem
Wissen aufkaufte?

27. Um welche zahlenmäßige Größenordnung gekaufter Unternehmen handelt
es sich dabei?

28. Welche Kosten entstanden hierfür im Einzelnen?

29. Inwiefern und auf welche Weise bzw. mit welchen Partner/-innen war
der BND bzw. das „Amt für Auslandsfragen“ mit der Sprachtechnologie
„METAL“ befasst?

30. Welche Kosten entstanden hierfür, und welche Firmen oder andere Einrich-
tungen erhielten entsprechende Gelder?

31. Inwiefern trifft es zu, dass deutsche Geheimdienste Firmen oder Kennt-
nisse des heutigen Professors A. W. vom Karlsruher Institut für Technolo-
gie (KIT) aufgekauft hat, und um welche handelte es sich dabei?

32. Inwiefern trifft es zu, dass der Projektkoordinator des EU-Forschungspro-
jektes SENSUS mit S. B. (Tarnname) ein BND-Angehöriger gewesen ist,
bzw. welche anderslautenden Erkenntnisse kann die Bundesregierung
hierzu beisteuern?

33. Inwiefern trifft es nach Kenntnis der Bundesregierung zu, dass die Zugehö-
rigkeit des „Amts für Auslandsfragen“ oder des S. B. zum BND der Euro-
päischen Kommission von Anfang an bekannt gewesen sei?

34. Inwiefern trifft es nach Kenntnis der Bundesregierung zu, dass der BND
sogar von sich aus an die Kommission herangetreten sei, um SENSUS auf
den Weg zu bringen, bzw. welche anderslautenden Erkenntnisse kann die
Bundesregierung hierzu beisteuern?

35. Welche Konsequenzen zog die Bundesregierung bzw. ihre zuständigen Be-
hörden aus der Verurteilung von S. B. wegen Fälschung eines Vertrages im
SENSUS-Projekt?

36. In welchen anderen Forschungsvorhaben der Bundesregierung, der EU
oder anderer internationaler Verbünde hat der BND in den letzten 15 Jahren
als „gewöhnlicher Dritter“ teilgenommen?

37. In welchen anderen Forschungsvorhaben der Bundesregierung, der EU
oder anderer internationaler Verbünde hat das Bundesamt für Verfassungs-
schutz in den letzten 15 Jahren als „gewöhnlicher Dritter“ teilgenommen?

38. Über welche Abteilungen bzw. andere, vom Bundesamt für Verfassungs-
schutz oder dem BND beauftragten oder gegründeten Firmen oder Einrich-
tungen, wurde dies abgewickelt?

39. Sofern die Bundesregierung hierzu Angaben verweigert oder teilweise zu-

rückhält, welche Angaben kann sie zum Umfang derartiger heimlicher
Teilnahme an der zivilen Sicherheitsforschung machen?

Deutscher Bundestag – 17. Wahlperiode – 5 – Drucksache 17/14798

40. Sofern die Bundesregierung auch hierzu Angaben verweigert oder teil-
weise zurückhält, inwiefern wird dies heute noch praktiziert?

41. Welche Kontakte pflegen die deutschen Geheimdienste Militärischer Ab-
schirmdienst, BND und das Bundesamt für Verfassungsschutz (BfV) hin-
sichtlich Technologien zur maschinellen Sprachverarbeitung oder foren-
sischen Phonetik mit ausländischen Partnerdiensten aus den USA, Großbri-
tannien, Israel und Australien?

42. Inwiefern werden mit den Partnern entsprechende Kapazitäten gemeinsam
genutzt oder beforscht?

43. Inwiefern verfügt auch das im Besitz des BND und BfV befindliche Über-
wachungswerkzeug X-Keyscore oder sonstige, im Zusammenhang mit der
bekanntgewordenen Spionageaffäre rund um den US-Geheimdienst NSA
an deutsche Dienste überlassene Hard- und Software über Funktionalitäten
Sprecherkennung, Stimmanalyse, nachträglichen Bearbeitung von Audio-
aufzeichnungen, Spracherkennung oder automatisierten Übersetzung?

44. Inwiefern werden automatisiert ausgewertete oder bearbeitete, abgehörte
audiobasierte Telekommunikationsverkehre an ausländische Dienste wei-
tergegeben, und inwiefern werden diese zuvor durch menschliche Bedie-
ner/-innen kontrolliert?

45. Worum handelt es sich bei dem „Runden Tisch zur Sicherstellung der Tele-
kommunikationsüberwachung in der Zukunft“ des Bundesinnenministe-
riums, auf wessen Veranlassung wurde dieser eingerichtet, und wer ist dort
(auch anlassbezogen) beteiligt oder eingeladen?

46. Welche Forschungen zur maschinellen Sprachverarbeitung oder foren-
sischen Phonetik oder automatisierten Übersetzung finanziert bzw. finan-
zierte die Bundesregierung in den letzten 15 Jahren?

47. Wer war mit welchen Aufgaben an den jeweiligen Projekten beteiligt?

48. Welche finanziellen Mittel stellte die Bundesregierung über welche Bun-
desministerien hierfür bereit (bitte auch für die Geheimdienste angeben)?

49. Welche Forschungen zur maschinellen Sprachverarbeitung oder foren-
sischen Phonetik oder automatisierten Übersetzung finanziert bzw. finan-
zierte die Europäische Kommission nach Kenntnis der Bundesregierung in
den letzten 15 Jahren, und in welchen der Vorhaben waren deutsche Behör-
den oder andere deutsche Partner/-innen beteiligt?

50. Inwiefern verfügt auch die Polizeiagentur EUROPOL nach Kenntnis der
Bundesregierung über Werkzeuge zur maschinellen Sprachverarbeitung
oder forensischen Phonetik oder automatisierten Übersetzung?

51. Inwiefern arbeiten welche deutschen Behörden hierfür in welchen Vorha-
ben mit EUROPOL zusammen?

52. In welchen Fällen haben welche Behörden des Bundesinnenministeriums,
des Bundesverteidigungsministeriums und des Bundeskanzleramts in den
letzten 15 Jahren welche ausländischen Behörden in der maschinellen
Sprachverarbeitung oder forensischen Phonetik oder automatisierten Über-
setzung geschult oder ausgebildet, und um welche ausländischen Behörden
handelte es sich dabei (bitte auch angeben, wenn es sich um einen „Aus-
tausch“ handelte)?

Berlin, den 23. September 2013
Dr. Gregor Gysi und Fraktion

x

Schnellsuche

Suchen Sie z.B.: "13 BGB" oder "I ZR 228/19". Die Suche ist auf schnelles Navigieren optimiert. Erstes Ergebnis mit Enter aufrufen.
Für die Volltextsuche in Urteilen klicken Sie bitte hier.