ปัจจุบันการใช้อินเทอร์เน็ตเข้ามามีบทบาทในชีวิตประจำวันมากขึ้น เพื่อใช้เป็นช่องทางในการติดต่อสื่อสารและแพร่กระจายข่าวสารข้อมูลต่างๆ เมื่อความนิยมในการใช้อินเทอร์เน็ตเป็นไปอย่างแพร่หลาย ทำให้ปริมาณข้อมูลมีมากขึ้นการสืบค้นข้อมูลจึงเป็นเรื่องยากลำบากในการค้นหา จึงมีบริการสืบค้นข้อมูล (Search Engine) เกิดขึ้นเพื่อเข้ามาช่วยในการสืบค้นข้อมูลให้ง่ายสะดวกและรวดเร็วมากยิ่งขึ้น Show
1. Spider หรือ Web Robot นอกจาก Spider จะทำงานหาลิงค์เพิ่มโดยอัตโนมัติแล้ว Search Engine ส่วนใหญ่อนุญาตให้ส่ง URL เพื่อกำหนดให้ Spider มาทำดัชนีที่เว็บไซต์ใดๆได้ ในปัจจุบันมีบริการที่จะส่ง URL ไป Search Engine หลายๆแห่งพร้อมกันในคราวเดียวเช่นที่ www.submit-it.com Spider หรือ Web Robot จะมีโปรแกรมคำสั่งที่เรียกว่า robots.txt คือการคำสั่งให้ Web Robot ของแต่ละ search engine นั้น ทำตามเก็บ index แต่ละอย่างที่เว็บไซต์ที่อนุญาติ โดยบางเว็บไซต์อาจไม่ต้องการให้ search engine เข้าไปในเว็บบางอย่าง ก็จะเขียนกำหนดได้บน Robot.txt นี้เอง robots.txt เป็น fileที่บอก Search engine ว่า ไม่ต้องมาเก็บเว็บไซต์นี้ หรือเว็บเพจบางหน้า หรือไฟล์บางไฟล์ Robot เป็นโปรแกรมเก็บข้อมูลในอินเตอร์เน็ต ซึ่งบางครั้ง เรียกว่า Spider หรือ ครอว์เลอร์(Crawler) จะทําหน้าที่รวบรวมไฟล์ HTML เพื่อมาเป็นข้อมูล สําหรับสร้างดัชนีค้นหา ให้กับ Search Engine โดยทั่วไปแล้ว โรบอตจะกลับมาที่เว็บไซต์ที่อ่านไปแล้ว เพื่อตรวจสอบ การเปลี่ยนแปลง ตามระยะเวลาที่กําหนด
3. Search Engine software Google ซึ่งเป็น Search Engine ที่ได้รับความนิยมอย่างมากในขณะนี้ มี Spider ที่มีความเร็วในการเก็บข้อมูลโดยที่ความเร็วสูงสุด Spider 4 ตัวสามารถรวบรวมข้อมูลได้มากกว่า 100 เว็บเพจต่อวินาที หรือได้ข้อมูลประมาณ 600 Kต่อวินาที เวลาปรกติประสิทธิภาพของ Spider และ indexer ทำให้ Google ดาวน์โหลดข้อมูลล่าสุด 11 ล้านหน้าในเวลาเพียง 63 ชั่วโมงเฉลี่ยเพียง 4 ล้านหน้าต่อวันหรือ 48.5 หน้าต่อวินาทีเพราะ indexer ทำงานเร็วกว่า Spider จีงมีเวลาพอเพียงเพิ่มประสิทธิภาพการทำ indexer เพื่อให้มันไม่คั่งค้าง ตัวอย่างสถาปัตยกรรม ของ Google ดังรูป รูปที่ 1 High Level Architecture Google
http://www.excite.com/ http://www.altavista.com/ http://www.lycos.com/ http://www.bing.com/2.Meta Search Engine Meta Search Engine คือ Search Engine ที่ใช้การค้นหาโดยอาศัย Meta Tag ในภาษา HTML ซึ่งมีการประกาศชุดคำสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML โดยค้นหาจากฐานข้อมูลของ Search Engine หลาย ๆ แห่ง แล้วแสดงผลลัพธ์ออกมาในมาตรฐานเดียวกัน เพราะ Meta Search Engine ไม่มีฐานข้อมูลของตนเอง จุดเด่นของการค้นหาด้วยวิธีการนี้ คือ สามารถเชื่อมโยงไปยัง Search Engine ประเภทอื่นๆ และยังมีความหลากหลายของข้อมูล จุดด้อยคือ ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือ ผู้ออกแบบเว็บจะใส่ ประโยค หรือถ้อยคำ (Keywords) ต่างๆเข้าไปมากมายเพื่อเวลาใครมาSearch จะได้พบเว็บ หรือ บล็อกของตนเองซึ่งประโยค หรือถ้อยคำต่างๆนั้นอาจไม่ตรงหรือเกี่ยวกับเว็บไซต์นั้นเลยก็ได้ และ อีกประการหนึ่งก็คือ มีการอาศัย Search Engine Index Server หลายๆ แห่งมาประมวลผลรวมกัน จึงทำให้ผลการค้นหาข้อมูลต่าง ๆ อาจไม่เที่ยงตรง ตัวอย่าง Meta Search Engine http://www.ixquick.com/ http://www.dogpile.com/ http://www.metacrawler.com/ http://www.mamma.com/ 3 Classified Directory Classified Directory คือสารบัญเว็บไซต์ที่ให้สามารถค้นหาข่าวสารข้อมูล จัดทำโดยมนุษย์ โดยนำข้อมูลที่ปรากฏใน Web ต่างๆ มาจัดเป็นหมวดหมู่ เป็นเรื่องๆ โครงสร้างของการจัดหมวดหมู่จะถูกเตรียมไว้ก่อน ภายใต้แต่ละเรื่องจะทำการแบ่งเป็นเรื่องย่อยๆ ตามลำดับจากเรื่องทั่วไป ไปสู่เรื่องที่มีความเฉพาะเจาะจงมากขึ้น จากนั้นจึงนำเว็บไซต์ต่างๆ ที่รวบรวมมาไปจัดเก็บตามหมวดหมู่ที่จัดทำไว้ ข้อดีของ Classified Directory คือการแบ่งหมวดหมู่ที่ชัดเจนช่วยนำทางในการเข้าถึงข้อมูลจากประเด็นกว้างๆ ที่ยังไม่ชัดเจนไปสู่ประเด็นเรื่องที่ชัดเจนทำให้ในการค้นผู้ใช้ไม่จำเป็นต้องมีความรู้ในเรื่องที่ค้นหรือคำศัพท์เฉพาะในเรื่องที่ค้นมาก่อน ข้อด้อยของ Classified Directory คือขนาดของฐานข้อมูลจะมีขนาดเล็กกว่า Search Engines ทั่วไปเนื่องจาก Classified Directory จัดทำดรรชนีโดยมนุษย์ความรู้ของผู้จัดทำ และผู้ใช้ แตกต่างกันไปปัญหาอาจเกิดจากการจัดทำหมวดหมู่ เช่น - การกำหนดโครงสร้างความสัมพันธ์ของหมวดหมู่ไม่ชัดเจน ไม่สมเหตุสมผล - โครงสร้างหมวดใหญ่ หมวดย่อยมีความซ้ำซ้อน หรือคาบเกี่ยวกัน - เรื่องเดียวกันแต่อยู่ได้หลายที่หลายระดับ อาจสร้างความสับสนให้กับผู้ค้นได้ การเพิ่มชื่อเว็บไซต์เข้าสู่เว็บ Classified Directory ในอดีตการเพิ่มชื่อเว็บไซต์เข้าสู่เว็บ Classified Directory สามารถทำได้ฟรี ไม่มีค่าใช้จ่าย แต่ปัจจุบันมีการทำการตลาดเพื่อให้เว็บไซต์เป็นที่รู้จัก การนำเว็บไซต์เข้าสู่ระบบฐานข้อมูลของ Classified Directory สามารถทำได้ดังนี้ 1. Free Submission คือ Classified Directory ที่ยอมให้เพิ่มชื่อเว็บไซต์เข้าสู่ระบบฐานข้อมูลโดยไม่มีค่าใช้จ่าย 2. Reciprocal Link คือ Classified Directory ที่ต้องทำ Link กลับมาก่อนจึงจะสามารถเพิ่มชื่อเว็บไซต์เข้าสู่ระบบฐานข้อมูลได้ 3. Paid Submissions คือ Classified Directory ที่ต้องจ่ายค่าธรรมเนียมในการเพิ่มชื่อเว็บไซต์เข้าสู่ฐานข้อมูลเว็บไดเรคทอรี่ ตัวอย่าง Classified Directory http://www.dmoz.org/ http://www.galaxy.com/ http://www.yahoo.com/ http://www.sanook.com/ 4. Subject Gateway Subject Gateway คือ Classified Directory จัดทำขึ้นเพื่อใช้ค้นหาข้อมูลในเรื่องใดเรื่องหนึ่งโดยเฉพาะ เช่นกฎหมาย ศาสนา ศิลปะ การศึกษา สุขภาพ มีการแบ่งหมวดและแยกหัวเรื่องโดยบรรณารักษ์ เน้นการรวบรวมทั้งในระดับกว้างและลึกของสาขาวิชาที่รับผิดชอบ ตัวอย่าง Subject Gateway ที่น่าสนใจคือ 1. http://scholar.google.com/ เป็นการร่วมมือกันทั้งจากองค์กรการศึกษา นักวิชาการ และทีมงานด้านเทคนิค เพื่อร่วมกันจัดการกับดัชนีต่างๆ ที่จำเป็นต้องเข้าถึงเนื้อหาข้อมูล รวมถึงการพัฒนาในส่วนของเทคนิคต่าง ๆข้อมูลบางชนิดไม่สามารถจะนำมาเชื่อมโยงได้โดยบริการค้นหาข้อมูลแบบธรรมดา ทำให้ Search Engine ไม่อาจค้นหาข้อมูลเหล่านั้นได้ บริการ Google Scholar มีข้อดีก็คือทำให้ผู้ที่ต้องการค้นหาข้อมูลแบบเฉพาะทางได้พบเจอข้อมูลเหล่านั้นให้ผู้ใช้สามารถค้นหาหรือทางสำเนาดิจิตอลของบทความว่าออนไลน์หรือในห้องสมุดโดยอาจเป็นข้อมูลวิชาการซึ่งปรากฏโดยอ้างอิงจาก'ข้อความเต็มของบทความ,วารสารรายงานทางเทคนิค, วิทยานิพนธ์ หนังสือและเอกสารอื่น ๆ ที่คิดว่าน่าจะเป็นเรื่องที่เกี่ยวข้อง หรือน่าสนใจ 2. http://www.hw.ac.uk/libwww/irn/pinakes/pinakes.html เป็น Subject Gateway เฉพาะที่เรียกตัวเองว่า Multi-Subject Gateways คือรวบรวมเอา Subject Gateway หลายๆที่มารวมที่เว็บไซต์ของตนเอง เห็นได้ว่า Search Engine แต่ละที่มีวิธีการจัดเก็บฐานข้อมูลที่แตกต่างกันไปตามประเภทของ Search Engine ที่นำมาใช้เก็บรวบรวมข้อมูล ดังนั้นการที่จะเข้าไปหาข้อมูลหรือเว็บไซต์ โดยวิธีการ Search เพื่อที่จะให้ได้ข้อมูลตรงกับวัตถุประสงค์และความต้องการมากที่สุดจะต้องทราบว่า เว็บไซต์ที่เข้าไปใช้บริการ ใช้วิธีการหรือ ประเภทของ Search Engine อะไร เนื่องจากแต่ละประเภทมีความละเอียดในการจัดเก็บข้อมูลต่างกันไป ในปัจจุบัน Search Engine มีอยู่มากมายแต่ได้รับความนิยมอยู่ไม่กี่เว็บไซต์โดย www.google.com มีผู้มาใช้มากที่สุด ประมาณ 70%และเมื่อนำ www.google.com , search.yahoo.com , www.bing.com มารวมกันจะได้ส่วนแบ่งตลาดไปเกือบทั้งหมดคือประมาณ 90% ดูได้จากตารางต่อไปนี้ Top Search Engine - Volume The following report shows search engines for the industry 'All Categories', ranked by Volume of Searches for the 4 weeks ending21/08/2010. Top Search Engines – Visits The following report shows websites for the industry 'Computers and Internet - Search Engines', ranked by Visits for the week ending21/08/2010.
Meta tags ที่จะแทรกนั้นจะมี 2 อย่างคือ 1.Description เป็นส่วนที่ใช้บอกรายละเอียดของเว็บเพจแบบคร่าวๆ 2.Keywords เป็นส่วนที่ใช้บอก คำที่เกี่ยวข้องกับเว็บเพจหน้านี้ เป็นคำที่ใช้ในการค้นหาหน้านี้
1.เปิดหน้าเว็บเพจที่เราต้องการแทรก Meta tags ขึ้นมา 2.ไปที่ Menu เลือก Insert > HTML > Head Tags > Description 3.จะมีกล่องข้อความขี้นมาให้เขียนรายละเอียดลงไปในกล่องนั้น ใส่ได้เฉพาะตัวอักษรห้ามใส่ Code ต่างๆ จะ เป็นภาษาอังกฤษ หรือไทยก็ได้ Search Engine คือ อะไร พร้อมยกตัวอย่าง 5 ตัวอย่างเสิร์ชเอ็นจิ้น (Search Engine) คือ เครื่องมือสำหรับค้นหาข้อมูลที่อยู่บนอินเตอร์เน็ต ด้วยคำค้นต่างๆ ซึ่งข้อมูลนั้น อาจอยู่ในรูปแบบของเว็บไซต์ ไฟล์เอกสาร ไฟล์รูปภาพ สื่อมัลติมีเดีย ไฟล์บีบอัด และรูปแบบอื่นๆ ที่สามารถบันทึกเป็นเอกสารออนไลน์ได้ ตัวอย่างเว็บไซต์ที่มีลักษณะเป็น Search Engine มีดังนี้ http://www.google.com.
Google จัดเป็น Search Engines ประเภทใดGoogle Search คือเครื่องมือค้นหาแบบอัตโนมัติโดยสมบูรณ์ซึ่งใช้ซอฟต์แวร์ที่เรียกว่า Web Crawler ในการสำรวจเว็บเป็นประจำเพื่อค้นหาหน้าเว็บที่จะเพิ่มไปยังดัชนีของเรา ในความเป็นจริง หน้าเว็บส่วนใหญ่ที่แสดงในผลการค้นหาไม่ได้ส่งข้อมูลมาให้รวมไว้ในดัชนี แต่ระบบค้นพบและเพิ่มหน้าเว็บเหล่านั้นโดยอัตโนมัติในขณะที่ Web Crawler ...
ข้อใดคือลักษณะของโปรแกรมค้นหาประเภท Crawler Based Search EngineCrawler Based Search Engines คือ เครื่องมือการค้นหาบนอินเทอร์เน็ตแบบอาศัยการบันทึก ข้อมูล และ จัดเก็บข้อมูลเป็นหลัก ซึ่งจะเป็นจำพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผล การค้นหาแม่นยำที่สุด และการประมวลผลการค้นหาสามารถทำได้อย่างรวดเร็ว จึงทำให้มีบทบาทในการ ค้นหาข้อมูลมากที่สุดในปัจจุบัน
เสิร์ชเอ็นจิ้น คืออะไร?เสิร์ชเอนจิน (search engine) หรือ โปรแกรมค้นหา คือ โปรแกรมที่ช่วยในการสืบค้นหาข้อมูล โดยเฉพาะข้อมูลบนอินเทอร์เน็ต โดยครอบคลุมทั้งข้อความ รูปภาพ ภาพเคลื่อนไหว เพลง ซอฟต์แวร์ แผนที่ ข้อมูลบุคคล กลุ่มข่าว และอื่น ๆ ซึ่งแตกต่างกันไปแล้วแต่โปรแกรมหรือผู้ให้บริการแต่ละราย.
|