ภาพปัจจุบัน

วันจันทร์ที่ 21 พฤษภาคม พ.ศ. 2555

Search Engine คืออะไร

Search Engine คืออะไร


กลับมาพูดถึงกันอีกครั้งกับ Search Engine?คืออะไร?อันที่จริงแล้วนี่ ผมตั้งใจจะเขียนเรื่องนี้มานานมากแล้ว แต่ว่าข้อมูลไม่เพียงพอก็เลยไม่ได้ออนไลน์ให้กับหลาย ๆ ท่านได้อ่านกันหนะครับ วันนี้ได้โอกาส ก็เลยจะมานั่งหาข้อมูลและเขียนให้จบไปสักตอนก่อนก็ยังดี
เพื่อเป็นการเจาะลึกเนื้อหาและข้อมูลเกี่ยวกับ Search Engine คืออะไรและรายละเอียดต่าง ๆ ของ Search Engine เพื่อเป็นข้อมูลให้หลาย ๆ ท่านที่ยังไม่ทราบ หรือ กำลังหาข้อมูลจะได้นำไปใช้ให้เกิดประโยชน์ ผมก็เลยได้พยายามรวบรวมข้อมูลต่าง ๆ จากหลายแห่ง เพื่อจะนำมาเขียนบทความชุดนี้
Search Engine คืออะไร ?
Search Engine คือ เครื่องมือการค้นหาข้อมูลผ่านอินเตอร์เน็ต ที่ทุกคนสามารถเข้าไปค้นหาข้อมูลผ่านอินเตอร์เน็ตก็ได้ โดย กรอก ข้อมูลที่ต้องการค้นหา หรือ Keyword (คีเวิร์ด) เข้าไปที่ช่อง Search Box แล้วกด Enter แค่นี้ข้อมูลที่เราค้นหาก็จะถูกแสดงออกมาอย่างมากมายก่ายกอง เพื่อให้เราเลือกข้อมูลที่เราโดนใจที่สุดเอามาใช้ งาน โดยลักษณะการแสดงผลของ Search Engine นั้นจะทำการแสดงผลแบบ เรียงอันดับ Search Results ผ่านหน้าจอคอมพิวเตอร์ของเรา




Search Engine มีกี่ประเภท ?
Search Engine มี?3?ประเภท (ในวันที่ทำการศึกษาข้อมูลนี้และได้ทำการรวบรวมข้อมูล ผมสรุปได้?3 ประเภทหลัก) โดยมีหลักการทำงานที่ต่างกัน และ การจัดอันดับการค้นหาข้อมูลก็ต่างกันด้วยครับ เพราะมีลักษณะการทำงานที่ต่างกันนี่เองทำให้ โดยทั่ว ๆ ไปแล้วจะมีการแบ่งออกเป็นหลาย ๆ ประเภทด้วยกัน แต่ที่พอสรุปได้ก็มีเพียง?3 ประเภทหลัก ๆ ดังที่จะนำเสนอต่อไปนี้ครับ
ประเภทที่ 1 Crawler Based Search Engines
Crawler Based Search Engines คือ เครื่องมือการค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บข้อมูลเป็นหลัก ซึ่งจะเป็นจำพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยำที่สุด และการประมวลผลการค้นหาสามารถทำได้อย่างรวดเร็ว จึงทำให้มีบทบาทในการค้นหาข้อมูลมากที่สุดในปัจจุบัน
โดยมีองประกอบหลักเพียง 2 ส่วนด้วยกันคือ
1. ฐานข้อมูล โดยส่วนใหญ่แล้ว Crawler Based Search Engine เหล่านี้จะมีฐานข้อมูลเป็นของตัวเอง ที่มีระบบการประมวลผล และ การจัดอันดับที่เฉพาะ เป็นเอกลักษณ์ของตนเองอย่างมาก
2. ซอฟแวร์ คือเครื่องมือหลักสำคัญที่สุดอีกส่วนหนึ่งสำหรับ Serch Engine ประเภทนี้ เนื่องจากต้องอาศัยโปรแกรมเล็ก ๆ (ชนิดที่เรียกว่า จิ๋วแต่แจ๋ว) ทำหน้าที่ในการตรวจหา และ ทำการจัดเก็บข้อมูล หน้าเพจ หรือ เว็บไซต์ต่าง ๆ ในรูปแบบของการทำสำเนาข้อมูล เหมือนกับต้นฉบับทุกอย่าง ซึ่งเราจะรู้จักกันในนาม Spider หรือ Web Crawler หรือ Search Engine Robots
ตัวอย่างหนึ่งของ Crawler Based Search Engine ชื่อดัง http://www.google.com

google





Crawler Based Search Engine ได้แก่อะไรบ้าง
จะยกตัวอย่างคร่าว ๆ ให้ได้เห็นกันเอาแบบที่เรา ๆ ท่าน ๆ รู้จักหนะครับก็ได้แก่? Google , Yahoo, MSN, Live, Search, Technorati (สำหรับ blog)?ครับ ส่วนลักษณะการทำงาน และ การเก็บข้อมูงของ Web Crawler หรือ Robot หรือ Spider นั้นแต่ละแห่งจะมีวิธีการเก็บข้อมูล และ การจัดอันดับข้อมูลที่ต่างกันนะครับ เช่น คุณทำการค้นหาคำว่า Search Engine คืออะไรผ่านทั้ง 5 แห่งที่ผมให้ไว้จะได้ผลการค้นหาที่ต่างกันครับ
ประเภทที่ 2 Web Directory หรือ Blog Directory
Web Directory หรือ Blog Directory คือ สารบัญเว็บไซต์ที่ให้คุณสามารถค้นหาข่าวสารข้อมูล ด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกัน ในปริมาณมาก ๆ คล้าย ๆ กับสมุดหน้าเหลืองครับ ซึ่งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่ อย่างชัดเจน ซึ่งจะช่วยให้การค้นหาข้อมูลต่าง ๆ ตามหมวดหมู่นั้น ๆ ได้รับการเปรียบเทียบอ้างอิง เพื่อหาข้อเท็จจริงได้ ในขณะที่เราค้นหาข้อมูล เพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้าย ๆ กันในหมวดหมู่เดียวกัน ให้เราเลือกที่จะหาข้อมูลได้ อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา) ซึ่งผมจะขอยกตัวอย่างดังนี้


ODP Web Directory ชื่อดังของโลก ที่มี Search Engine มากมายใช้เป็นฐานข้อมูล Directory 1.? ODP หรือ Dmoz ที่หลาย?ๆ คนรู้จัก ซึ่งเป็น Web Directory ที่ใหญ่ที่สุดในโลก Search Engine หลาย ๆ แห่งก็ใช้ข้อมูลจากที่แห่งนี้เกือบทั้งสิ้น เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ อีกมากมาย ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลก รวมถึงภาษาไทยเราด้วยครับ (URL : http://www.dmoz.org )
2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อเสียงอีกเช่นกัน และเป็นที่รู้จักมากที่สุดในเมืองไทย (URL : http://webindex.sanook.com )
3. Blog Directory อย่าง BlogFlux Directory ที่มีการเก็บข้อมูลเกี่ยวกับบล็อกมากมายตามหมวดหมู่ต่าง ๆ หรือ Blog Directory อื่น ๆ ที่สามารถหาได้จาก Make Many แห่งนี้ครับ
ประเภทที่ 3 Meta Search Engine
Meta Search Engine คือ Search Engine ที่ใช้หลักการในการค้นหาโดยอาศัย Meta Tag ในภาษา HTML ซึ่งมีการประกาศชุดคำสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML นั่นเองเช่น ชื่อผู้พัฒนา คำค้นหา เจ้าของเว็บ หรือ บล็อก คำอธิบายเว็บหรือบล็อกอย่างย่อ
ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือ ผู้ออกแบบเว็บสามารถใส่อะไรเข้าไปก็ได้มากมายเพื่อให้เกิดการค้นหาและพบเว็บ หรือ บล็อกของตนเอง และ อีกประการหนึ่งก็คือ มีการอาศัย Search Engine Index Server หลาย?ๆ แห่งมาประมวลผลรวมกัน จึงทำให้ผลการค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร.
มาถึงตอนนี้หลาย ๆ ท่านที่เคยสงสัยว่า Search Engine คืออะไรคงได้หายสงสัยกันไปบ้างแล้วและเริ่มเข้าใจหลักการทำงานของ Search Engine กันมากขึ้น เพื่อจะได้เลือกใช้อย่างถูกต้องและตรงกับความต้องการของเราในการค้นหาข่าวสารข้อมูล สำหรับบทความ “Search Engine คืออะไรนี้หากขาดตกบกพร่องประการใด หรือ ไม่ได้รับข้อมูลที่ชัดเจนท่านสามารถติชม หรือ ให้ข้อเสนอแนะต่าง ๆ ผ่าน Comments ของบทความชุดนี้เพื่อจะได้ทำการปรับปรุงและแก้ไขให้ได้ข้อมูลที่ดีที่สุดและ เป็นประโยชน์สำหรับ ผู้ที่ทำการค้นคว้างข้อมูลต่าง ๆ เพื่อนำไปใช้งาน.
สิทธิศักดิ์? บุญมาก
เขียน 30-09-2006

ข้อมูลอ้างอิง
http://www.it-guides.com/lesson/search_engine_01.html
http://www.nectec.or.th/courseware/internet/web-tech/0021.html
http://gotoknow.org/blog/bow
http://truehits.net/faq/f_stat.php
http://www.keng.com/?p=64

ขอขอบคุณเพื่อน ๆ ชาว SEO ใน http://www.seo.in.th ทุกท่านที่ใด้ให้ความรู้ต่าง ๆ จนสามารถเขียนบทความนี้ได้สำเร็จลุล่วงไปด้วยดี.























            ารค้นหาข้อมูลด้วยเว็บไซต์ค้นหานั้น เพื่อให้ขอบข่ายของการค้นหาแคบเข้า สามารถค้นหาได้ง่ายและรวดเร็วขึ้น จะต้องใช้เว็บไซต์การค้นหาเข้าช่วย เช่น


การค้นหาข้อมูลด้วย Basic Search จากเว็บไซต์ www.siamguru.com
            Basic Search คือ เครื่องมือในการค้นหาว็บไซต์ ทำหน้าที่ในการให้บริการค้นหาข้อมูล (Search Engine) โดยเน้นเรื่องความสามารถในการค้นหาข้อมูลภาษาไทยบนอินเทอร์เน็ต  มีความสามารถเทียบเท่าเสิร์ชเอ็นจิ้นชื่อดังจากต่างประเทศ  โดยการค้นหาจะเป็นแบบค้นหาข้อมูลจากทุกคำของข้อมูลจริง (Full Text Search) ทั้งภาษาไทย และ ภาษาอังกฤษจากเว็บเพจจำนวนหลายแสนหน้า  มีการเก็บรวบรวมข้อมูลเว็บเพจที่เกี่ยวข้องกับประเทศไทยมาจัดทำดัชนี (index) โดยอัตโนมัติ ผสมกับการจัดแยกหมวดหมู่อย่างชัดเจน เพื่อให้ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ง่ายและรวดเร็วมากที่สุด
            เว็บไซต์ www.siamguru.com แบ่งการค้นหาเป็น 4 รูปแบบคือ
  • ช่องค้นหา เป็นช่องป้อนข้อความที่เป็นเงื่อนไข สำหรับกำหนดคำ/ข้อความที่เป็นเงื่อนไขในการค้นหา
  • คำแนะนำพร้อมตัวอย่างการใช้งาน เป็นข้อความที่อยู่ภายใต้ช่องค้นหา เพื่อแนะนำการใช้งาน Search Engine อย่างง่าย พร้อมตัวอย่างการใช้งาน
  • ปุ่ม "Go" ปุ่มสำหรับสั่งให้ทำการค้นหา

            Super Search เป็นเครื่องมือค้นหาข้อมูลในอินเทอร์เน็ตอีกประเภทหนึ่ง เหมาะสำหรับผู้ที่คุ้นเคยกับ Basic Search อยู่แล้ว แต่ต้องการค้นหาข้อมูลให้ได้ผลลัพธ์ตรงความต้องการมากขึ้นกว่าที่จะสามารถทำได้ใน Basic Search ด้วยวิธีการสร้างเงื่อนไขการค้นหาขึ้น ซึ่งจะได้ผลลัพธ์ที่น่าพอใจกว่าใน Basic Search ในขณะเดียวกันการค้นหาแบบ Super Search ก็จะมีความซับซ้อนในการใช้งานด้วยเช่นกัน
  • ข้อความแบบมีเงื่อนไข เป็นช่องสำหรับกำหนดข้อความที่เป็นเงื่อนไขในการค้นหา
  • เสียงคล้าย เป็นช่องระบุว่าต้องการคำที่ออกเสียงคล้ายคลึงกันได้
  • คำแนะนำพร้อมตัวอย่างการใช้งาน เป็นข้อความที่อยู่ภายใต้ช่องค้นหา เพื่อแนะนำการใช้งาน Search Engine อย่างง่าย พร้อมตัวอย่างการใช้งาน
  • ปุ่ม "Go" ปุ่มสำหรับสั่งให้ทำการค้นหา
เงื่อนไขที่ใช้ใน Super Search
  • การค้นหาโดยใช้เงื่อนไข "AND"
    รูปแบบการใช้งาน : A and B โดย A , B เป็น คำหลัก (Keywords)
    อธิบาย : เราใช้เงื่อนไข "and" ก็ต่อเมื่อ ต้องการให้ปรากฏคำหลัก A และ B ในหน้าเว็บเพจเดียวกัน หมายถึง การค้นหาคำหลักที่มีทั้ง A และ B
    Example 1: พิมพ์ ไทย and จีน ลงในช่องข้อความแบบมีเงื่อนไข จะหมายถึง ค้นหาคำว่า ไทย และ จีน โดยผลลัพธ์จากการค้นหา จะปรากฏคำว่า "ไทย" และ "จีน" อยู่ในหน้าเว็บเพจเดียวกัน


  • การค้นหาโดยใช้เงื่อนไข "OR"
    รูปแบบการใช้งาน : A or B
    อธิบาย : เราใช้เงื่อนไข "or" ก็ต่อเมื่อ ต้องการค้นหาคำหลัก A หรือ B โดยผลลัพธ์จากการค้นหาจะต้องปรากฏคำหลัก A หรือ B อย่างใดอย่างหนึ่ง หรือ ทั้งสองคำ
    Example 2: พิมพ์ กีฬา or ดนตรี ลงในช่องข้อความแบบมีเงื่อนไข Super Search จะค้นหาข้อมูลที่ปรากฏคำว่า "กีฬา" หรือ "ดนตรี" ในหน้าเว็บเพจ


  • การค้นหาโดยใช้เงื่อนไข "NOT"
    รูปแบบการใช้งาน : A not B
    อธิบาย : เราใช้เงื่อนไข "not" ก็ต่อเมื่อ ต้องการค้นหา A แต่ไม่ต้องการให้ปรากฏ B อยู่ในหน้าเว็บเพจ
    Example 3: พิมพ์ กีฬา not ฟุตบอล จะหมายถึง การค้นหาเว็บเพจที่ปรากฏคำว่า "กีฬา" แต่ต้องไม่ปรากฏคำว่า "ฟุตบอล"


  • การค้นหาโดยใช้เงื่อนไข "NEAR"
    รูปแบบการใช้งาน : A near B
    อธิบาย : หมายถึง เป็นการระบุให้ผลลัพธ์ของการค้นหาต้องปรากฏทั้ง A และ B และทั้งสองคำนี้จะต้องปรากฏอยู่ใกล้ๆกัน รูปแบบการค้นหาแบบนี้จะคล้ายกับการใช้เงื่อนไข "AND" แต่ต่างกันเพียง คำทั้งสองจะต้องปรากฏอยู่ห่างกันไม่เกิน 10 คำ ซึ่งเราจะเห็นว่าการใช้เงื่อนไข NEAR จะมีประสิทธิภาพที่ดีกว่าการใช้เงื่อนไข "AND" ในกรณีที่คำทั้งสองมีความเกี่ยวข้องกัน โดยคาดหวังว่าคำทั้งสองน่าจะปรากฏอยู่ใกล้เคียงกัน ยกตัวอย่างเช่น
            เราค้นหา วัด near อยุธยา ผลลัพธ์ที่ออกมาน่าจะได้หน้าเว็บเพจที่คำว่า "วัด" และ "อยุธยา" ที่ทั้งสองคำนี้น่าจะมีความเกี่ยวข้องกัน มากกว่า วัด and อยุธยา ที่ปรากฏคำทั้งสองคำนี้ในหน้าเว็บเพจแต่อาจจะไม่เกี่ยวข้องกันเลยก็ได้
    Example 4: พิมพ์ วัด near อยุธยา หมายถึง การค้นหาเว็บเพจที่มีทั้งคำว่า วัด และ อยุธยา อยู่ในหน้า เว็บเพจเดียวกัน และคำทั้งสองน่าจะปรากฏอยู่ใกล้เคียงกัน


  • การค้นหาโดยใช้เครื่องหมายวงเล็บ "(   )"
    รูปแบบการใช้งาน : (A * B) โดย A และ B เป็นคำที่ต้องการค้นหา และ สัญญลักษณ์ * แทนเงื่อนไข and , or ,not และ near
    อธิบาย : การใช้เครื่องหมายวงเล็บคร่อมข้อความที่เป็นเงื่อนไข หมายถึง การเจาะจงให้ประมวลผลข้อความที่อยู่ภายในวงเล็บก่อน
    Example 5: พิมพ์ (การเมือง or เศรษฐกิจ) near รัฐสภา หมายถึง การสั่งให้ค้นหาหน้าเอกสารเว็บเพจที่ปรากฏคำว่า "การเมือง" หรือ "เศรษฐกิจ" และ จะต้องปรากฏอยู่ใกล้เคียงกับคำว่า "รัฐสภา" ด้วย



ไม่มีความคิดเห็น:

แสดงความคิดเห็น

แสดงความคิดเห็น