Skip to main content

2021 | OriginalPaper | Buchkapitel

13. Ein KI-basiertes Framework für Sprach- und Stimmanalyse zur automatischen Bewertung der Qualität von Servicegesprächen

verfasst von : Mathias Walther

Erschienen in: Künstliche Intelligenz in der Anwendung

Verlag: Springer Fachmedien Wiesbaden

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

In diesem Kapitel wird ein innovatives zweistufiges Klassifikationsframework vorgestellt, das auf Basis multipler Modelle für den Sprechausdruck qualitätsinduzierende Kriterien bei Callcentergesprächen mit erklärungsfähigen Regeln prognostizieren kann. Durch diese Basisklassifikation wird eine symbolische Repräsentation des Sprechausdrucks erzeugt, die sowohl für Experten verständlich ist als auch von Klassifikationsalgorithmen verarbeitet werden kann. In der zweiten Stufe werden mit Lernverfahren die erkannten sprecherisch-stimmlichen Merkmale zu einer Klassifikation der Qualitätsfaktoren zusammengeführt. Regeln und Entscheidungsbäume bilden die funktionalen Beziehungen zu den relevanten Merkmalen ab und können so anhand der erkannten sprecherisch-stimmlichen Merkmale die wahrgenommenen Qualitätsfaktoren erklären.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Literatur
1.
Zurück zum Zitat Bose I (2003) dóch da sin ja‘ nur mûster: Kindlicher Sprechausdruck im sozialen Rollenspiel. Peter, Frankfurt Bose I (2003) dóch da sin ja‘ nur mûster: Kindlicher Sprechausdruck im sozialen Rollenspiel. Peter, Frankfurt
2.
Zurück zum Zitat Burkhardt F, Audibert N, Malatesta L, Türk O, Arslan L, Auberge V (2006) Emotional Prosody – does culture make a difference. Speech Prosody 2(5) Burkhardt F, Audibert N, Malatesta L, Türk O, Arslan L, Auberge V (2006) Emotional Prosody – does culture make a difference. Speech Prosody 2(5)
3.
Zurück zum Zitat Chang H (2007) Comparing machine and human performance for caller’s directory assistance requests. Int J Speech Technol 10(2):75–87CrossRef Chang H (2007) Comparing machine and human performance for caller’s directory assistance requests. Int J Speech Technol 10(2):75–87CrossRef
4.
Zurück zum Zitat Devillers L, Lamel L, Vasilescu I (2003) Emotion detection in task-oriented spoken dialogues. In: Multimedia and Expo, 2003. ICME’03. Proceedings. 2003 International Conference on. IEEE, III–549 Devillers L, Lamel L, Vasilescu I (2003) Emotion detection in task-oriented spoken dialogues. In: Multimedia and Expo, 2003. ICME’03. Proceedings. 2003 International Conference on. IEEE, III–549
5.
Zurück zum Zitat Eyben F, Wöllmer M, Schuller B (2009) openEAR – introducing the Munich open-source emotion and affect recognition toolkit. In: Proc. 4th International HUMAINE Association Conference on Affective Computing and Intelligent Interaction 2009 (ACII2009), Band I, 576–581. IEEE, 2009 Eyben F, Wöllmer M, Schuller B (2009) openEAR – introducing the Munich open-source emotion and affect recognition toolkit. In: Proc. 4th International HUMAINE Association Conference on Affective Computing and Intelligent Interaction 2009 (ACII2009), Band I, 576–581. IEEE, 2009
6.
Zurück zum Zitat Focsa I, Neuhaus T (2003) Aufbau eines Qualitätsmanagementsystems im Call Center. GfAH Selbstverlag, Dortmund, 17–38 Focsa I, Neuhaus T (2003) Aufbau eines Qualitätsmanagementsystems im Call Center. GfAH Selbstverlag, Dortmund, 17–38
7.
Zurück zum Zitat Fojut S (2008) Call Center Lexikon: Die wichtigsten Fachbegriffe der Branche verständlich erklärt. Gabler, Wiesbaden Fojut S (2008) Call Center Lexikon: Die wichtigsten Fachbegriffe der Branche verständlich erklärt. Gabler, Wiesbaden
8.
Zurück zum Zitat Gavalda M, Schlueter J (2010) „The truth is out there“: using advanced speech analytics to learn why customers call help-line desks and how effectively they are being served by the call center agent. In: Advances in speech recognition. Springer, Berlin, 221–243 Gavalda M, Schlueter J (2010) „The truth is out there“: using advanced speech analytics to learn why customers call help-line desks and how effectively they are being served by the call center agent. In: Advances in speech recognition. Springer, Berlin, 221–243
9.
Zurück zum Zitat Hall M, Frank E, Holmes G et al. (2009) The WEKA data mining software: an update. SIGKDD Explor Newsl 11(1):10–18 Hall M, Frank E, Holmes G et al. (2009) The WEKA data mining software: an update. SIGKDD Explor Newsl 11(1):10–18
10.
Zurück zum Zitat Hirschfeld U, Neuber B (2011) Optimierungsmöglichkeiten der Telekommunikation aus Sicht der Sprechwissenschaft – Überblick über Fragestellungen und Untersuchungsansätze. In: Hirschfeld U, Neuber B (Hrsg) Erforschung und Optimierung der Callcenterkommunikation. Frank & Timme, Berlin, 9–28 Hirschfeld U, Neuber B (2011) Optimierungsmöglichkeiten der Telekommunikation aus Sicht der Sprechwissenschaft – Überblick über Fragestellungen und Untersuchungsansätze. In: Hirschfeld U, Neuber B (Hrsg) Erforschung und Optimierung der Callcenterkommunikation. Frank & Timme, Berlin, 9–28
11.
Zurück zum Zitat Lassmann W (Hrsg.), Rogge R, Schwarzer J (2006) Wirtschaftsinformatik: Nachschlagewerk für Studium und Praxis. Gabler, Wiesbaden Lassmann W (Hrsg.), Rogge R, Schwarzer J (2006) Wirtschaftsinformatik: Nachschlagewerk für Studium und Praxis. Gabler, Wiesbaden
12.
Zurück zum Zitat Lefter I, Wiggers P, Rothkrantz L (2010) EmoReSp: an online emotion recognizer based on speech. In: Proceedings of the 11th International Conference on Computer Systems and Technologies and Workshop for PhD Students in Computing on International Conference on Computer Systems and Technologies. ACM, New York, (CompSysTech ’10), 287–292 Lefter I, Wiggers P, Rothkrantz L (2010) EmoReSp: an online emotion recognizer based on speech. In: Proceedings of the 11th International Conference on Computer Systems and Technologies and Workshop for PhD Students in Computing on International Conference on Computer Systems and Technologies. ACM, New York, (CompSysTech ’10), 287–292
13.
Zurück zum Zitat Meißner S, Pietschmann J (2011a) Rhetorische und phonetische Einflussfaktoren auf die Qualität von Telefonverkaufsgesprächen. In: Hirschfeld U, Neuber B (Hrsg) Erforschung und Optimierung der Callcenterkommunikation. Frank & Timme, Berlin, 215–248 Meißner S, Pietschmann J (2011a) Rhetorische und phonetische Einflussfaktoren auf die Qualität von Telefonverkaufsgesprächen. In: Hirschfeld U, Neuber B (Hrsg) Erforschung und Optimierung der Callcenterkommunikation. Frank & Timme, Berlin, 215–248
14.
Zurück zum Zitat Meißner S, Pietschmann J (2011b) Zur Beurteilung der Gesprächsqualität im telefonischen Verkauf – Zwischenbericht über ein Forschungsprojekt. In: Bose I, Neuber B (Hrsg) Interpersonale Kommunikation: Analyse und Optimierung. Lang, Frankfurt, S 303–312 Meißner S, Pietschmann J (2011b) Zur Beurteilung der Gesprächsqualität im telefonischen Verkauf – Zwischenbericht über ein Forschungsprojekt. In: Bose I, Neuber B (Hrsg) Interpersonale Kommunikation: Analyse und Optimierung. Lang, Frankfurt, S 303–312
15.
Zurück zum Zitat Mishne G, Carmel D, Hoory R, Roytman A, Soffer A (2005) Automatic analysis of call-center conversations. In: Proceedings of the 14th ACM international conference on Information and knowledge management. ACM, 453–459 Mishne G, Carmel D, Hoory R, Roytman A, Soffer A (2005) Automatic analysis of call-center conversations. In: Proceedings of the 14th ACM international conference on Information and knowledge management. ACM, 453–459
16.
Zurück zum Zitat Morrison D, Wang R, De Silva, Liyanage (2007) Ensemble methods for spoken emotion recognition in call-centres. Speech Commun 49(2):98–112 Morrison D, Wang R, De Silva, Liyanage (2007) Ensemble methods for spoken emotion recognition in call-centres. Speech Commun 49(2):98–112
17.
Zurück zum Zitat Neuber B, Hirschfeld U (2013) Sprechwirkungsforschung in der professionellen Telefonie. In: Veličkova L, Petročenko E (Hrsg) Klangsprache im Fremdsprachenunterricht, Bd. VII. Voronezh State University, Voronezh, 66–85 Neuber B, Hirschfeld U (2013) Sprechwirkungsforschung in der professionellen Telefonie. In: Veličkova L, Petročenko E (Hrsg) Klangsprache im Fremdsprachenunterricht, Bd. VII. Voronezh State University, Voronezh, 66–85
18.
Zurück zum Zitat Neppert J, Pétursson M (1986) Elemente einer Akustischen Phonetik, 2. Aufl. Helmut Buske, Hamburg Neppert J, Pétursson M (1986) Elemente einer Akustischen Phonetik, 2. Aufl. Helmut Buske, Hamburg
19.
Zurück zum Zitat Paeschke A (2003) Prosodische Analyse emotionaler Sprechweise. Logos, Berlin (Mündliche Kommunikation) Paeschke A (2003) Prosodische Analyse emotionaler Sprechweise. Logos, Berlin (Mündliche Kommunikation)
20.
Zurück zum Zitat Petrushin V (1999) Emotion in speech: recognition and application to call centers. In: Artificial Neural Nets in Engineering (ANNIE ’99), 7–14 Petrushin V (1999) Emotion in speech: recognition and application to call centers. In: Artificial Neural Nets in Engineering (ANNIE ’99), 7–14
21.
Zurück zum Zitat Pfister B, Kaufmann T (2008) Sprachverarbeitung. Springer, Berlin Pfister B, Kaufmann T (2008) Sprachverarbeitung. Springer, Berlin
22.
Zurück zum Zitat Pittermann J, Pittermann A (2006): Integrating emotion recognition into an adaptive spoken language dialogue system. In: Intelligent Environments, 2006. IE 06. 2nd IET International Conference on. IET, 197–202 Pittermann J, Pittermann A (2006): Integrating emotion recognition into an adaptive spoken language dialogue system. In: Intelligent Environments, 2006. IE 06. 2nd IET International Conference on. IET, 197–202
23.
Zurück zum Zitat Scherer K (2013) Vocal markers of emotion: comparing induction and acting elicitation. Comput Speech Lang 27(1):40–58CrossRef Scherer K (2013) Vocal markers of emotion: comparing induction and acting elicitation. Comput Speech Lang 27(1):40–58CrossRef
24.
Zurück zum Zitat Schuller B, Batliner A (2014) Computational paralinguistics: emotion, affect and personality in speech and language processing. Wiley, New York Schuller B, Batliner A (2014) Computational paralinguistics: emotion, affect and personality in speech and language processing. Wiley, New York
25.
Zurück zum Zitat Schuller B, Steidl S, Batliner A, et al. (2012) The INTERSPEECH 2012 Speaker Trait Challenge. In: Proceedings INTERSPEECH Schuller B, Steidl S, Batliner A, et al. (2012) The INTERSPEECH 2012 Speaker Trait Challenge. In: Proceedings INTERSPEECH
26.
Zurück zum Zitat Schuller B, Steidl S, Batliner A, et al. (2010) The INTERSPEECH 2010 Paralinguistic Challenge. In: Proceedings INTERSPEECH, 2795–2798 Schuller B, Steidl S, Batliner A, et al. (2010) The INTERSPEECH 2010 Paralinguistic Challenge. In: Proceedings INTERSPEECH, 2795–2798
27.
Zurück zum Zitat Stahlknecht P, Hasenkamp U (1999) Einführung in die Wirtschaftsinformatik, 9. Aufl. Springer, BerlinCrossRef Stahlknecht P, Hasenkamp U (1999) Einführung in die Wirtschaftsinformatik, 9. Aufl. Springer, BerlinCrossRef
28.
Zurück zum Zitat Thompson W, Balkwill L (2006) Decoding speech prosody in five languages. Semiotica 2006(158):407–424CrossRef Thompson W, Balkwill L (2006) Decoding speech prosody in five languages. Semiotica 2006(158):407–424CrossRef
29.
Zurück zum Zitat Vidrascu L, Devillers L (2007) Five emotion classes detection in real-world call center data: the use of various types of paralinguistic features. In: Proceedings of the International Workshop on Paralinguistic Speech – between Models and Data. Citeseer, 11–16 Vidrascu L, Devillers L (2007) Five emotion classes detection in real-world call center data: the use of various types of paralinguistic features. In: Proceedings of the International Workshop on Paralinguistic Speech – between Models and Data. Citeseer, 11–16
30.
Zurück zum Zitat Walther M (2018) Automatische Erkennung paralinguistischer Merkmale zur Bewertung der Gesprächsqualität in Callcentern: Zweistufige maschinelle Klassifikation mittels multipler Lernverfahren und perzeptiver Kriterien. In: Hoffmann R (Hrsg) Studientexte zur Sprachkommunikation, Bd. 89. TUDpress, Dresden Walther M (2018) Automatische Erkennung paralinguistischer Merkmale zur Bewertung der Gesprächsqualität in Callcentern: Zweistufige maschinelle Klassifikation mittels multipler Lernverfahren und perzeptiver Kriterien. In: Hoffmann R (Hrsg) Studientexte zur Sprachkommunikation, Bd. 89. TUDpress, Dresden
31.
Zurück zum Zitat Walther M, Neuber B, Jokisch O, Mellouli T (2015) Towards a conversational expert system for rhetorical and vocal quality assessment in call center talks. SlaTE 2015:29–34 Walther M, Neuber B, Jokisch O, Mellouli T (2015) Towards a conversational expert system for rhetorical and vocal quality assessment in call center talks. SlaTE 2015:29–34
32.
Zurück zum Zitat Walther M, Mellouli T (2017) „Intelligente Systeme zur Bewertung der Gesprächsqualität im Callcenter – Stand der Forschung und experimentelle Ergebnisse”. In: Neuber B, Pietschmann J (Hrsg) Dialogoptimierung in der Telekommunikation. Bd. 9. Schriften zur Sprechwissenschaft und Phonetik. Frank & Timme, Berlin Walther M, Mellouli T (2017) „Intelligente Systeme zur Bewertung der Gesprächsqualität im Callcenter – Stand der Forschung und experimentelle Ergebnisse”. In: Neuber B, Pietschmann J (Hrsg) Dialogoptimierung in der Telekommunikation. Bd. 9. Schriften zur Sprechwissenschaft und Phonetik. Frank & Timme, Berlin
33.
Zurück zum Zitat Walther M, Mellouli T, Jokisch O (2015) Fusion von Klassifikationsmodellen zur automatischen Erkennung von Stimmeigenschaften in der Qualitätsbewertung von Callcentergesprächen. In: Wirsching G (Hrsg) ESSV 2015. TUDpress, Dresden, 188–195 Walther M, Mellouli T, Jokisch O (2015) Fusion von Klassifikationsmodellen zur automatischen Erkennung von Stimmeigenschaften in der Qualitätsbewertung von Callcentergesprächen. In: Wirsching G (Hrsg) ESSV 2015. TUDpress, Dresden, 188–195
34.
Zurück zum Zitat Weninger F, Wöllmer M, Schuller B (2014) Emotion recognition in naturalistic speech and language – a survey. In: Konar A, Chakraborty A (Hrsg) Emotion recognition: a pattern analysis approach. Wiley, New Jersey, 237–268 Weninger F, Wöllmer M, Schuller B (2014) Emotion recognition in naturalistic speech and language – a survey. In: Konar A, Chakraborty A (Hrsg) Emotion recognition: a pattern analysis approach. Wiley, New Jersey, 237–268
35.
Zurück zum Zitat Yacoub S, Simske S, Lin X, Burns J (2003) Recognition of emotions in interactive voice response systems. Eurospeech 2003:1–4 Yacoub S, Simske S, Lin X, Burns J (2003) Recognition of emotions in interactive voice response systems. Eurospeech 2003:1–4
Metadaten
Titel
Ein KI-basiertes Framework für Sprach- und Stimmanalyse zur automatischen Bewertung der Qualität von Servicegesprächen
verfasst von
Mathias Walther
Copyright-Jahr
2021
DOI
https://doi.org/10.1007/978-3-658-30936-7_13

Premium Partner