Skip to main content

2021 | OriginalPaper | Buchkapitel

3. Wie Suchmaschinen die Inhalte des Web erfassen und aufbereiten

verfasst von : Dirk Lewandowski

Erschienen in: Suchmaschinen verstehen

Verlag: Springer Berlin Heidelberg

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config
loading …

Zusammenfassung

In diesem Kapitel wird die technische Basis der Suchmaschinen beschrieben. Dabei geht es darum, wie die im Web vorhandenen Dokumente überhaupt in die Suchmaschine gelangen, wie sie durchsuchbar gemacht werden und wie die Verbindung zwischen einer Suchanfrage und den Dokumenten im Datenbestand hergestellt wird.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

  • über 102.000 Bücher
  • über 537 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Maschinenbau + Werkstoffe
  • Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 390 Zeitschriften

aus folgenden Fachgebieten:

  • Automobil + Motoren
  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Elektrotechnik + Elektronik
  • Energie + Nachhaltigkeit
  • Maschinenbau + Werkstoffe




 

Jetzt Wissensvorsprung sichern!

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

  • über 67.000 Bücher
  • über 340 Zeitschriften

aus folgenden Fachgebieten:

  • Bauwesen + Immobilien
  • Business IT + Informatik
  • Finance + Banking
  • Management + Führung
  • Marketing + Vertrieb
  • Versicherung + Risiko




Jetzt Wissensvorsprung sichern!

Fußnoten
1
Die Sätze stammen aus dem Wikipedia-Artikel zum Thema (http://​de.​wikipedia.​org/​wiki/​Granularsynthese​).
 
Literatur
Zurück zum Zitat Baeza-Yates, R., & Ribeiro-Neto, B. (2011). Modern information retrieval: The concepts and technology behind search. Addison Wesley. Baeza-Yates, R., & Ribeiro-Neto, B. (2011). Modern information retrieval: The concepts and technology behind search. Addison Wesley.
Zurück zum Zitat Baumeister, H., & Schwärzel, K. (2019). Wissenswelt Internet: Eine Infrastruktur und ihr Recht. de Gruyter. Baumeister, H., & Schwärzel, K. (2019). Wissenswelt Internet: Eine Infrastruktur und ihr Recht. de Gruyter.
Zurück zum Zitat Chang, Y., & Deng, H. (Hrsg.). (2020). Query understanding for search engines. Springer. Chang, Y., & Deng, H. (Hrsg.). (2020). Query understanding for search engines. Springer.
Zurück zum Zitat Croft, W. B., Metzler, D., & Strohman, T. (2010). Search engines: Information retrieval in practice. Pearson. Croft, W. B., Metzler, D., & Strohman, T. (2010). Search engines: Information retrieval in practice. Pearson.
Zurück zum Zitat Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. In NAACL HLT 2019 – 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies – Proceedings of the Conference (S. 4171–4186). Minneapolis, Minnesota. Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. In NAACL HLT 2019 – 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies – Proceedings of the Conference (S. 4171–4186). Minneapolis, Minnesota.
Zurück zum Zitat Gulli, A., & Signorini, A. (2005). The indexable web is more than 11.5 billion pages. In E. Allan & H. Tatsuya (Hrsg.), Proceedings of the 14th international conference on World Wide Web. Chiba, Japan, May 10–14, 2005. (S. 902–903). New York: ACM. https://doi.org/10.1145/1062745.1062789. Gulli, A., & Signorini, A. (2005). The indexable web is more than 11.5 billion pages. In E. Allan & H. Tatsuya (Hrsg.), Proceedings of the 14th international conference on World Wide Web. Chiba, Japan, May 10–14, 2005. (S. 902–903). New York: ACM. https://​doi.​org/​10.​1145/​1062745.​1062789.​
Zurück zum Zitat Lewandowski, D. (2009a). Handbuch Internet-Suchmaschinen: Nutzerorientierung in Wissenschaft und Praxis. Akademische Verlagsgesellschaft AKA. Lewandowski, D. (2009a). Handbuch Internet-Suchmaschinen: Nutzerorientierung in Wissenschaft und Praxis. Akademische Verlagsgesellschaft AKA.
Zurück zum Zitat Lewandowski, D. (2009b). Spezialsuchmaschinen. In D. Lewandowski (Hrsg.), Handbuch Internet-Suchmaschinen: Nutzerorientierung in Wissenschaft und Praxis (S. 53–69). Akademische Verlagsgesellschaft AKA. Lewandowski, D. (2009b). Spezialsuchmaschinen. In D. Lewandowski (Hrsg.), Handbuch Internet-Suchmaschinen: Nutzerorientierung in Wissenschaft und Praxis (S. 53–69). Akademische Verlagsgesellschaft AKA.
Zurück zum Zitat Lewandowski, D. (2011). Query understanding. In D. Lewandowski (Hrsg.), Handbuch Internet-Suchmaschinen 2: Neue Entwicklungen in der Web-Suche (S. 55–75). Akademische Verlagsgesellschaft AKA. Lewandowski, D. (2011). Query understanding. In D. Lewandowski (Hrsg.), Handbuch Internet-Suchmaschinen 2: Neue Entwicklungen in der Web-Suche (S. 55–75). Akademische Verlagsgesellschaft AKA.
Zurück zum Zitat Lewandowski, D. (2013). Suchmaschinen. In R. Kuhlen, W. Semar & D. Strauch (Hrsg.), Grundlagen der praktischen Information und Dokumentation (6. Aufl., S. 495–508). de Gruyter Saur. Lewandowski, D. (2013). Suchmaschinen. In R. Kuhlen, W. Semar & D. Strauch (Hrsg.), Grundlagen der praktischen Information und Dokumentation (6. Aufl., S. 495–508). de Gruyter Saur.
Zurück zum Zitat Manning, C. D., Raghavan, P., & Schütze, H. (2008). Introduction to information retrieval. Cambridge University Press.CrossRef Manning, C. D., Raghavan, P., & Schütze, H. (2008). Introduction to information retrieval. Cambridge University Press.CrossRef
Zurück zum Zitat Ntoulas, A., Cho, J., & Olston, C. (2004). What’s new on the web?: The evolution of the web from a search engine perspective. In S. I. Feldman, M. Uretsky, M. Najork & C. E. Wills (Hrsg.), Proceedings of the 13th international conference on World Wide Web. New York, NY, USA, May 17–20, 2004. (S. 1–12). New York: ACM. https://doi.org/10.1145/988672.988674. Ntoulas, A., Cho, J., & Olston, C. (2004). What’s new on the web?: The evolution of the web from a search engine perspective. In S. I. Feldman, M. Uretsky, M. Najork & C. E. Wills (Hrsg.), Proceedings of the 13th international conference on World Wide Web. New York, NY, USA, May 17–20, 2004. (S. 1–12). New York: ACM. https://​doi.​org/​10.​1145/​988672.​988674.​
Zurück zum Zitat Stock, W. G. (2007). Information Retrieval: Informationen suchen und finden. Oldenbourg. Stock, W. G. (2007). Information Retrieval: Informationen suchen und finden. Oldenbourg.
Metadaten
Titel
Wie Suchmaschinen die Inhalte des Web erfassen und aufbereiten
verfasst von
Dirk Lewandowski
Copyright-Jahr
2021
Verlag
Springer Berlin Heidelberg
DOI
https://doi.org/10.1007/978-3-662-63191-1_3