nach oben

Erschienen in:

2021 | OriginalPaper | Buchkapitel

3. Wie Suchmaschinen die Inhalte des Web erfassen und aufbereiten

verfasst von : Dirk Lewandowski

Erschienen in: Suchmaschinen verstehen

Verlag: Springer Berlin Heidelberg

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

Zusammenfassung

In diesem Kapitel wird die technische Basis der Suchmaschinen beschrieben. Dabei geht es darum, wie die im Web vorhandenen Dokumente überhaupt in die Suchmaschine gelangen, wie sie durchsuchbar gemacht werden und wie die Verbindung zwischen einer Suchanfrage und den Dokumenten im Datenbestand hergestellt wird.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Vorheriges Kapitel Formen der Suche im Web

Nächstes Kapitel Wie Suchmaschinen genutzt werden

Die Sätze stammen aus dem Wikipedia-Artikel zum Thema (http://de.wikipedia.org/wiki/Granularsynthese).

Abbt, C. (2016). Recht auf Vergessen? Ethik der zweiten Chance? Deutsche Zeitschrift für Philosophie, 64(6), 925–946. https://doi.org/10.1515/dzph-2016-0068.CrossRef

Alpert, J., & Hajaj, N. (2008). We knew the web was big … Google Official Blog. http://googleblog.blogspot.de/2008/07/we-knew-web-was-big.html. Zugegriffen am 18.01.2021.

Baeza-Yates, R., & Ribeiro-Neto, B. (2011). Modern information retrieval: The concepts and technology behind search. Addison Wesley.

Baumeister, H., & Schwärzel, K. (2019). Wissenswelt Internet: Eine Infrastruktur und ihr Recht. de Gruyter.

Bharat, K., & Broder, A. (1998). A technique for measuring the relative size and overlap of public web search engines. Computer Networks and ISDN Systems, 30(1–7), 379–388. https://doi.org/10.1016/S0169-7552(98)00127-5.CrossRef

van den Bosch, A., Bogers, T., & de Kunder, M. (2016). Estimating search engine index size variability: A 9-year longitudinal study. Scientometrics, 107(2), 839–856. https://doi.org/10.1007/s11192-016-1863-z.CrossRef

Broder, A., Kumar, R., Maghoul, F., Raghavan, P., Rajagopalan, S., Stata, R., et al. (2000). Graph structure in the web. Computer Networks, 33(1–6), 309–320. https://doi.org/10.1016/S1389-1286(00)00083-9.CrossRef

Chang, Y., & Deng, H. (Hrsg.). (2020). Query understanding for search engines. Springer.

Croft, W. B., Metzler, D., & Strohman, T. (2010). Search engines: Information retrieval in practice. Pearson.

Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. In NAACL HLT 2019 – 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies – Proceedings of the Conference (S. 4171–4186). Minneapolis, Minnesota.

Fuhr, N. (2013). Modelle im Information Retrieval. In R. Kuhlen, W. Semar & D. Strauch (Hrsg.), Grundlagen der praktischen Information und Dokumentation (6. Aufl., S. 322–335). de Gruyter Saur. https://doi.org/10.1515/9783110258264.CrossRef

Google. (2017). Alles über Google News. https://web.archive.org/web/20170321083046/https://www.google.de/intl/de_de/about_google_news.html. Zugegriffen am 27.01.2021.

Google Search Central. (2020). How we fought Search spam on Google – Webspam Report 2019. https://developers.google.com/search/blog/2020/06/how-we-fought-search-spam-on-google. Zugegriffen am 27.01.2021.

Gulli, A., & Signorini, A. (2005). The indexable web is more than 11.5 billion pages. In E. Allan & H. Tatsuya (Hrsg.), Proceedings of the 14th international conference on World Wide Web. Chiba, Japan, May 10–14, 2005. (S. 902–903). New York: ACM. https://doi.org/10.1145/1062745.1062789.

Karaganis, J., & Urban, J. (2015). The rise of the robo notice. Communications of the ACM, 58(9), 28–30. https://doi.org/10.1145/2804244.CrossRef

Lawrence, S., & Giles, C. L. (1999). Accessibility of information on the web. Nature, 400(8), 107–107. https://doi.org/10.1038/21987.CrossRef

Levene, M. (2010). An introduction to search engines and web navigation (2. Aufl.). Wiley. https://doi.org/10.1002/9780470874233.CrossRef

Lewandowski, D. (2009a). Handbuch Internet-Suchmaschinen: Nutzerorientierung in Wissenschaft und Praxis. Akademische Verlagsgesellschaft AKA.

Lewandowski, D. (2009b). Spezialsuchmaschinen. In D. Lewandowski (Hrsg.), Handbuch Internet-Suchmaschinen: Nutzerorientierung in Wissenschaft und Praxis (S. 53–69). Akademische Verlagsgesellschaft AKA.

Lewandowski, D. (2011). Query understanding. In D. Lewandowski (Hrsg.), Handbuch Internet-Suchmaschinen 2: Neue Entwicklungen in der Web-Suche (S. 55–75). Akademische Verlagsgesellschaft AKA.

Lewandowski, D. (2013). Suchmaschinen. In R. Kuhlen, W. Semar & D. Strauch (Hrsg.), Grundlagen der praktischen Information und Dokumentation (6. Aufl., S. 495–508). de Gruyter Saur.

Manning, C. D., Raghavan, P., & Schütze, H. (2008). Introduction to information retrieval. Cambridge University Press.CrossRef

Nayak, P. (2019). Understanding searches better than ever before. https://www.blog.google/products/search/search-language-understanding-bert/. Zugegriffen am 27.01.2021.

Ntoulas, A., Cho, J., & Olston, C. (2004). What’s new on the web?: The evolution of the web from a search engine perspective. In S. I. Feldman, M. Uretsky, M. Najork & C. E. Wills (Hrsg.), Proceedings of the 13th international conference on World Wide Web. New York, NY, USA, May 17–20, 2004. (S. 1–12). New York: ACM. https://doi.org/10.1145/988672.988674.

Risvik, K. M., & Michelsen, R. (2002). Search engines and web dynamics. Computer Networks, 39(3), 289–302. https://doi.org/10.1016/S1389-1286(02)00213-X.CrossRef

Sánchez, D., Martínez-Sanahuja, L., & Batet, M. (2018). Survey and evaluation of web search engine hit counts as research tools in computational linguistics. Information Systems, 73, 50–60. https://doi.org/10.1016/j.is.2017.12.007.CrossRef

Schwartz, B. (2016). Google’s search knows about over 130 trillion pages. http://searchengineland.com/googles-search-indexes-hits-130-trillion-pages-documents-263378. Zugegriffen am 26.01.2021.

Stock, W. G. (2007). Information Retrieval: Informationen suchen und finden. Oldenbourg.

Strzelecki, A. (2019). Website removal from search engines due to copyright violation. Aslib Journal of Information Management, 71(1), 54–71. https://doi.org/10.1108/AJIM-05-2018-0108.CrossRef

Sullivan, D. (2005). Search engine sizes. Search Engine Watch. https://searchenginewatch.com/sew/study/2068075/search-engine-sizes. Zugegriffen am 20.01.2021.

Tyagi, V. (2017). Content-based image retrieval. Springer.CrossRef

Uyar, A. (2009). Investigation of the accuracy of search engine hit counts. Journal of Information Science, 35(4), 469–480. https://doi.org/10.1177/0165551509103598.MathSciNetCrossRef

Vaidhyanathan, S. (2011). The Googlization of Everything (and why we should worry). University of California Press. https://doi.org/10.1525/9780520948693.CrossRef

Vaughan, L., & Thelwall, M. (2004). Search engine coverage bias: Evidence and possible causes. Information Processing & Management, 40, 693–707. https://doi.org/10.1016/S0306-4573(03)00063-3.CrossRef

Vaughan, L., & Zhang, Y. (2007). Equal representation by search engines? A comparison of websites across countries and domains. Journal of Computer-Mediated Communication, 12, 888–909. https://doi.org/10.1111/j.1083-6101.2007.00355.x.CrossRef

Titel: Wie Suchmaschinen die Inhalte des Web erfassen und aufbereiten
verfasst von: Dirk Lewandowski
Verlag: Springer Berlin Heidelberg
Buch: Suchmaschinen verstehen
Print ISBN: 978-3-662-63190-4

Electronic ISBN: 978-3-662-63191-1

Copyright-Jahr: 2021
DOI: https://doi.org/10.1007/978-3-662-63191-1_3

Springer Professional

Zusammenfassung

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"