PangPong: ความรู้เกี่ยวกับ search engine และ web opac

Search Engine คืออะไร?

Search Engine (ภาษาไทย: เสิร์ชเอนจิน) เป็นโปรแกรมในการค้นหาข้อมูลต่าง ๆ ผ่านระบบเว็บไซต์และเครือข่ายอินเตอร์เน็ต เพื่อเข้าถึงเว็บไซต์ข้อมูลที่ต้องการค้นหา เรียกอย่างเป็นทางการว่า "โปรแกรมช่วยในการสืบค้นข้อมูล" ซึ่ง Search Engine สามารถสืบค้นได้ทั้งข้อความ รูปภาพ สื่อมัลติมิเดีย ภาพเคลื่อนไหว วีดิโอ และข้อมูลอื่น ๆ ได้ตามต้องการ โดยการกรอกคำค้นหา (Keyword) ลงไปในช่องคำค้นหาและคลิกค้นหา Search Engine ก็จะรายงานเว็บไซต์ที่เกี่ยวข้องกับคำค้นหานั้น ๆ ออกมาแสดงผลให้ผู้ใช้งานได้เห็น ผู้ใช้งานก็จะเลือกอ่าน Title, Description ที่เกี่ยวข้องกับคำค้นหาหรือข้อมูลที่ต้องการและคลิกเข้าสู่เว็บไซต์ข้อมูลเพื่อค้นหาข้อมูลต่อไป

เสิร์ชเอ็นจิ้น (Search Engine) คือ เครื่องมือสำหรับค้นหาข้อมูลที่อยู่บนอินเตอร์เน็ต ด้วยคำค้นต่างๆ ซึ่งข้อมูลนั้น อาจอยู่ในรูปแบบของเว็บไซต์ ไฟล์เอกสาร ไฟล์รูปภาพ สื่อมัลติมีเดีย ไฟล์บีบอัด และรูปแบบอื่นๆ ที่สามารถบันทึกเป็นเอกสารออนไลน์ได้ ตัวอย่างเว็บไซต์ที่มีลักษณะเป็น Search Engine มีดังนี้

กระบวนการทำงานของ Search Engine

โดยปกติแล้ว Search Engine จะมีเครื่องมือที่ชื่อว่า Robot (หุ่นยนต์) ในการสืบค้นเว็บไซต์ต่าง ๆ เพื่อนำมาจัดเก็บในระบบฐานข้อมูลด้วยการทำ Index โดย Robot จะเดินทางจากเว็บหนึ่ง ไปอีกเว็บหนึ่งผ่าน Hyperlink ที่มีอยู่ในเว็บไซต์นั้นๆ

การเรียงลำดับผลลัพธ์จากการค้นหา

Search Engine มีอัลกอลิธึ่มในการจัดลำดับผลลัพธ์การค้นหาแตกต่างกันไป ซึ่งโดยปกติแล้ว ส่วนมากจะเรียงจากความสัมพันธ์กับคำที่ใช้ค้นหา และมีปัจจัยอื่นๆ อีก เช่น ประเทศ ภาษา ขนาดของไฟล์ จำนวนผู้เข้าชม ความถี่ในการอัพเดทข้อมูล จำนวนลิงค์ เป็นต้น

ประโยชน์ของ Search Engine

Search Engine นั้นมีประโยชน์อย่างมากในการค้นหาข้อมูลบนอินเตอร์เน็ตและเป็นเหมือนตัวกลางในการเชื่อมต่อระหว่างผู้ใช้งานและเว็บไซต์ ปัจจุบันผู้ใช้งานส่วนใหญ่ใช้งาน Search Engine มากกว่าการเข้าชมเว็บไซต์โดยตรง เพราะว่าเว็บไซต์บนโลกมีมากมายหลายร้อยหลายพันล้านเว็บไซต์ และเราไม่สามารถรู้ได้ว่าข้อมูลที่เราต้องการนั้นอยู่ในเว็บไซต์ใด เพราะฉะนั้นผู้ใช้งานจึงใช้ Search Engine เป็นตัวกลางในการค้นหาข้อมูล เพื่อที่จะเข้าไปยังเว็บไซต์ที่มีข้อมูลที่ต้องการอยู่นั่นเอง

การทำงานของ Search Engine

Search Engine แต่ละประเภทจะมีการทำงานที่คล้าย ๆ กันนั่นคือ การส่ง Web Crawler หรือ Spider ไปเก็บข้อมูลเว็บไซต์ต่าง ๆ เข้ามาเก็บไว้ในระบบ เพื่อจัดทำเป็นดัชนี (Indexing) การค้นหา และเมื่อผู้ใช้งานค้นหาข้อมูลผ่าน Search Engine ตัวโปรแกรม Search Engine ก็จะทำการประมวลผลด้วยอัลกอลิทึมการจัดอันดับ (Ranking) และนำผลลัพท์จากข้อมูลที่มีอยู่ออกมาแสดงผลให้ผู้ใช้งานได้เห็น

Search Engine ที่เป็นที่นิยม

ในปัจจุบันผู้ใช้งานในประเทศไทยจะใช้งาน Google Search Engine ซึ่งคิดเป็น % แล้วมากถึง 95% เลยทีเดียว เนื่องด้วยคุณภาพ ความเร็วในการค้นหา และลูกเล่นอื่น ๆ เพราะฉะนั้นผู้ที่ต้องการทำ SEO ก็ควรที่จะศึกษาการทำงานของ Google เพื่อที่จะทำให้อันดับการค้นหาของเว็บไซต์ตัวเองอยู่ในอันดับต้น ๆ ได้นั่นเอง

Search Engine มี 3 ประเภท

(ในวันที่ทำการศึกษาข้อมูลนี้และได้ทำการรวบรวมข้อมูล ผมสรุปได้?3 ประเภทหลัก) โดยมีหลักการทำงานที่ต่างกัน และ การจัดอันดับการค้นหาข้อมูลก็ต่างกันด้วยครับ เพราะมีลักษณะการทำงานที่ต่างกันนี่เองทำให้ โดยทั่ว ๆ ไปแล้วจะมีการแบ่งออกเป็นหลาย ๆ ประเภทด้วยกัน แต่ที่พอสรุปได้ก็มีเพียง?3 ประเภทหลัก ๆ ดังที่จะนำเสนอต่อไปนี้ครับ

ประเภทที่ 1 Crawler Based Search Engines

Crawler Based Search Engines คือ เครื่องมือการค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บข้อมูลเป็นหลัก ซึ่งจะเป็นจำพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยำที่สุด และการประมวลผลการค้นหาสามารถทำได้อย่างรวดเร็ว จึงทำให้มีบทบาทในการค้นหาข้อมูลมากที่สุดในปัจจุบัน

โดยมีองประกอบหลักเพียง 2 ส่วนด้วยกันคือ

1. ฐานข้อมูล โดยส่วนใหญ่แล้ว Crawler Based Search Engine เหล่านี้จะมีฐานข้อมูลเป็นของตัวเอง ที่มีระบบการประมวลผล และ การจัดอันดับที่เฉพาะ เป็นเอกลักษณ์ของตนเองอย่างมาก
2. ซอฟแวร์ คือเครื่องมือหลักสำคัญที่สุดอีกส่วนหนึ่งสำหรับ Serch Engine ประเภทนี้ เนื่องจากต้องอาศัยโปรแกรมเล็ก ๆ (ชนิดที่เรียกว่า จิ๋วแต่แจ๋ว) ทำหน้าที่ในการตรวจหา และ ทำการจัดเก็บข้อมูล หน้าเพจ หรือ เว็บไซต์ต่าง ๆ ในรูปแบบของการทำสำเนาข้อมูล เหมือนกับต้นฉบับทุกอย่าง ซึ่งเราจะรู้จักกันในนาม Spider หรือ Web Crawler หรือ Search Engine Robots
ตัวอย่างหนึ่งของ Crawler Based Search Engine ชื่อดัง http://www.google.com

Crawler Based Search Engine ได้แก่อะไรบ้าง
จะยกตัวอย่างคร่าว ๆ ให้ได้เห็นกันเอาแบบที่เรา ๆ ท่าน ๆ รู้จักหนะครับก็ได้แก่? Google , Yahoo, MSN, Live, Search, Technorati (สำหรับ blog)?ครับ ส่วนลักษณะการทำงาน และ การเก็บข้อมูงของ Web Crawler หรือ Robot หรือ Spider นั้นแต่ละแห่งจะมีวิธีการเก็บข้อมูล และ การจัดอันดับข้อมูลที่ต่างกันนะครับ เช่น คุณทำการค้นหาคำว่า “Search Engine คืออะไร” ผ่านทั้ง 5 แห่งที่ผมให้ไว้จะได้ผลการค้นหาที่ต่างกันครับ

ประเภทที่ 2 Web Directory หรือ Blog Directory

Web Directory หรือ Blog Directory คือ สารบัญเว็บไซต์ที่ให้คุณสามารถค้นหาข่าวสารข้อมูล ด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกัน ในปริมาณมาก ๆ คล้าย ๆ กับสมุดหน้าเหลืองครับ ซึ่งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่ อย่างชัดเจน ซึ่งจะช่วยให้การค้นหาข้อมูลต่าง ๆ ตามหมวดหมู่นั้น ๆ ได้รับการเปรียบเทียบอ้างอิง เพื่อหาข้อเท็จจริงได้ ในขณะที่เราค้นหาข้อมูล เพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้าย ๆ กันในหมวดหมู่เดียวกัน ให้เราเลือกที่จะหาข้อมูลได้ อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา) ซึ่งผมจะขอยกตัวอย่างดังนี้

ODP Web Directory ชื่อดังของโลก ที่มี Search Engine มากมายใช้เป็นฐานข้อมูล Directory

1. ODP หรือ Dmoz ที่หลาย?ๆ คนรู้จัก ซึ่งเป็น Web Directory ที่ใหญ่ที่สุดในโลก Search Engine หลาย ๆ แห่งก็ใช้ข้อมูลจากที่แห่งนี้เกือบทั้งสิ้น เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ อีกมากมาย ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลก รวมถึงภาษาไทยเราด้วยครับ (URL : http://www.dmoz.org )
2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อเสียงอีกเช่นกัน และเป็นที่รู้จักมากที่สุดในเมืองไทย (URL : http://webindex.sanook.com )
3. Blog Directory อย่าง BlogFlux Directory ที่มีการเก็บข้อมูลเกี่ยวกับบล็อกมากมายตามหมวดหมู่ต่าง ๆ หรือ Blog Directory อื่น ๆ ที่สามารถหาได้จาก Make Many แห่งนี้ครับ

ประเภทที่ 3 Meta Search Engine

Meta Search Engine คือ Search Engine ที่ใช้หลักการในการค้นหาโดยอาศัย Meta Tag ในภาษา HTML ซึ่งมีการประกาศชุดคำสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML นั่นเองเช่น ชื่อผู้พัฒนา คำค้นหา เจ้าของเว็บ หรือ บล็อก คำอธิบายเว็บหรือบล็อกอย่างย่อ
ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือ ผู้ออกแบบเว็บสามารถใส่อะไรเข้าไปก็ได้มากมายเพื่อให้เกิดการค้นหาและพบเว็บ หรือ บล็อกของตนเอง และ อีกประการหนึ่งก็คือ มีการอาศัย Search Engine Index Server หลาย?ๆ แห่งมาประมวลผลรวมกัน จึงทำให้ผลการค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร.

มาถึงตอนนี้หลาย ๆ ท่านที่เคยสงสัยว่า “Search Engine คืออะไร” คงได้หายสงสัยกันไปบ้างแล้วและเริ่มเข้าใจหลักการทำงานของ Search Engine กันมากขึ้น เพื่อจะได้เลือกใช้อย่างถูกต้องและตรงกับความต้องการของเราในการค้นหาข่าวสารข้อมูล สำหรับบทความ “Search Engine คืออะไร” นี้หากขาดตกบกพร่องประการใด หรือ ไม่ได้รับข้อมูลที่ชัดเจนท่านสามารถติชม หรือ ให้ข้อเสนอแนะต่าง ๆ ผ่าน Comments ของบทความชุดนี้เพื่อจะได้ทำการปรับปรุงและแก้ไขให้ได้ข้อมูลที่ดีที่สุดและ เป็นประโยชน์สำหรับ ผู้ที่ทำการค้นคว้างข้อมูลต่าง ๆ เพื่อนำไปใช้งาน

ที่มาข้อมูล http://www.thaimeboard.com/faq/qa-id14.html

http://krukoon.wordpress.com/2010/04/19/search-engine

http://www.workboxs.com/thai/online-marketing/search-engine.html

http://www.youtube.com/watch?v=8Xxh5S3_IOg

WebOPAC
เว็บโอแพค

WebOPAC ย่อมาจาก Web Online Public Access Catalog หมายถึง การสืบค้นทรัพยากรสารสนเทศด้วยระบบออนไลน์ ซึ่งผู้ใช้สามารถสืบค้นทรัพยากรสารสนเทศที่ให้บริการภายในสำนักวิทยบริการ โดยสืบค้นผ่านทางหน้าเว็บไซต์ของสำนักวิทยบริการ ได้แก่ หนังสือ วารสาร จุลสาร รายงานการวิจัย วิทยานิพนธ์ รวมทั้งสื่อโสตทัศนวัสดุ และสื่ออิเล็กทรอนิกส์
เริ่มต้นการสืบค้น เข้าไปที่เว็บไซต์สำนักวิทยบริการที่ http://www.library.msu.ac.th หัวข้อสืบค้นสารสนเทศคลิกWebOPAC หรือพิมพ์คำค้นในช่องว่างซึ่งอยู่ด้านบนของเว็บไซต์ เลือกขอบเขต กดปุ่มสืบค้น ดังรูป

1. การสืบค้นหนังสือ
เพื่อให้ได้ทรัพยากรสารสนเทศสิ่งพิมพ์ เช่น หนังสือทั่วไป วิทยานิพนธ์ งานวิจัย นวนิยาย และ เรื่องสั้น ที่ให้บริการภายในสำนักวิทยบริการนั้น จะเิริ่มต้นอย่างไรดี การค้นหาหนังสือให้ได้ดังใจและรวดเร็วมีขั้นตอนนี้ดังนี้

1) สืบค้นจาก WebOPAC โดยเลือกใช้ขอบเขตหรือทางเลือกในการสืบค้นซึ่งมี 6 ทางเลือกได้แก่
- ผู้แต่ง หมายถึง ผู้แต่ง ผู้แต่งร่วม บรรณาธิการ ผู้แปลชื่อนิติบุคคล และชื่อรายงานการประชุมสัมมนา สำหรับผู้แต่งที่เป็นชาวต่างประเทศ ให้พิมพ์ชื่อสกุล ตามด้วยเครื่องหมายจุลภาค ( , ) ชื่อต้น และชื่อกลาง
- ชื่อเรื่อง หมายถึง ชื่อเรื่องของทรัพยากรสารสนเทศ
- หัวเรื่อง หมายถึง คำหรือวลีที่กำหนดขึ้นเพื่อบ่งบอกถึงเนื้อหาสาระสำคัญของหนังสือ เอกสาร หรือบทความ ตลอดจนทรัพยากรสารสนเทศอื่นๆ ทุกชนิด
- คำสำคัญ หมายถึง คำ หรือ วลี ที่ปรากฏอยู่ในส่วนใดส่วนหนึ่งของชื่อเรื่อง/ชื่อชุด/สารบัญ/บทคัดย่อ ฯลฯ ซึ่งจะใช้ในกรณีที่ไม่ทราบทั้งชื่อเรื่อง ผู้แต่ง และหัวเรื่อง
- เลขเรียกหนังสือ หมายถึง สัญลักษณ์ที่กำหนดให้กับทรัพยากรสารสนเทศประกอบด้วยเลขหมู่ พยัญชนะตัวแรกของชื่อผู้แต่ง เลขประจำตัวผู้แต่ง และพยัญชนะตัวแรกของชื่อเรื่อง เพื่อบอกตำแหน่งที่อยู่ของวัสดุนั้นๆ ในห้องสมุด
- ผู้แต่ง/ชื่อเรื่อง สามารถสืบค้นได้โดยพิมพ์ชื่อผู้แต่ง และชื่อเรื่องของทรัพยากรสารสนเทศ ซึ่งผู้ใช้ต้องทราบชื่อผู้แต่ง หรือหากทราบชื่อเรื่องของทรัพยากรสารสนเทศนั้นๆ จะทำให้สามารถจำกัดผลการสืบค้นได้

2) พิมพ์คำที่ต้องการสืบค้นสารสนเทศในช่องว่าง คลิกทางเลือกการสืบค้น ได้แก่ ผู้แต่ง ชื่อเรื่อง หัวเรื่อง คำสำคัญ เลขเรียกหนังสือ หรือ ผู้แต่ง/ชื่อเรื่อง จากรูปตัวอย่างเป็นวิธีการสืบค้นหนังสือโดยเลือกใช้ขอบเขตการสืบค้นจากชื่อผู้แต่ง คลิกที่ปุ่มสืบค้น
* ถ้าเริ่มต้นสืบค้นโดยที่ไม่ทราบชื่อผู้แต่งหรือชื่อเรื่อง ให้เลือกสืบค้นจากขอบเขต "คำสำคัญ"

3) หน้าจอแสดงผลการสืบค้น โดยแสดง ชื่อเรื่อง สถานที่จัดเก็บ เลขเรียก และสถานภาพ ให้ตรวจสอบดูสถานที่จัดเก็บหนังสือที่ต้องการนั้นว่าจัดเก็บอยู่ที่ใด มีสถานภาพอยู่บนชั้น ถูกยืมออกไปแล้ว หรือห้ามยืมออก ผู้ใช้สามารถดูประเภทของทรัพยากรและสถานที่จัดเก็บ จากนั้นให้จดเลขเรียกแล้วหยิบหนังสือบนชั้น แล้วนำไปยืมที่เครื่องยืมหนังสืออัตโนมัติ

2. การสืบค้นบทความ
จะมีวิธีการสืบค้นเริ่มแรกไม่แตกต่างจากการสืบค้นหนังสือ แต่ผู้สืบค้นต้องตรวจสอบเพิ่มเติมว่าบทความเรื่องที่ต้องการนั้นอยู่ในวารสารชื่อเรื่องอะไร และจัดเก็บอยู่ที่ใด ซึ่งวารสารจะมีอยู่ 3 สถานภาพ คือ
- วารสารฉบับปัจจุบัน  หมายถึง วารสารฉบับล่าสุด ให้บริการที่ชั้นวารสารใหม่สีส้ม ชั้น 3
- วารสารล่วงเวลา  หมายถึง วารสารที่นำลงมาจากชั้นวารสารใหม่สีส้ม และถูกนำมาจัดเก็บไว้ให้บริการที่เคาน์เตอร์วารสารล่วงเวลาชั้น 3 และเพื่อรอเย็บเล่ม ผู้ใช้บริการสามารถกรอกแบบฟอร์มขอใช้บริการกับบรรณารักษ์ที่เคาน์เตอร์วารสารล่วงเวลาชั้น 3 และนำวารสารไปถ่ายสำเนาได้ที่ศูนย์ถ่ายเอกสาร สำนักวิทยบริการ ชั้น 3
- วารสารเย็บเล่ม  หมายถึง วารสารที่ถูกนำมาเย็บเล่มแล้วจัดไว้ให้บริการที่ชั้นวารสารสีน้ำเงิน ผู้ใช้บริการสามารถหยิบตัวเล่มด้วยตนเองและนำไปถ่ายสำเนาเอกสารได้
ขั้นตอนการสืบค้นมีดังนี้
1) สืบค้นจาก Web OPAC โดยใช้ชื่อผู้แต่ง หรือชื่อเรื่อง หรือหัวเรื่อง หรือคำสำคัญ เพื่อตรวจสอบว่ามีบทความที่ต้องการหรือไม่ จากรูปตัวอย่างเป็นการสืบค้นหาบทความโดยใช้ขอบเขตการสืบค้นจากชื่อเรื่อง เมื่อได้ผลลัพธ์การสืบค้นให้เลื่อกรายการที่ต้องการแล้วคลิกเข้าไปดูแหล่งข้อมูลหรือชื่อวารสารของบทความเรื่องนั้น ในกรณีที่มีผลลัพธ์เยอะและต้องการคัดเลือกเอาเฉพาะบทความ ให้คลิกที่ปุ่มเมนู Limit/Sort Search
  * Limit/Sort Search หรือการจำกัดผลลัพธ์ ใช้เพื่อคัดกรองทรัพยากรสารสนเทศที่ต้องการได้ทุกประเภท

2) จากนั้นให้เลือกประเภทวัสดุ เป็น "ดรรชนีวารสาร" เพื่อกรองผลลัพธ์ให้ได้เฉพาะบทความวารสารเท่านั้น แล้วคลิกปุ่ม Submit เพื่อยืนยัน

3) ให้เลือกบทความเรื่องที่สนใจ จากนั้นคลิกที่ "ดูรายละเอียดวารสาร" หน้าจอจะแสดงเลขเรียก สถานที่จัดเก็บ และวารสารฉบับที่มีให้บริการ ให้ผู้ใช้บริการคลิกที่ "Latest Received" เพื่อตรวจสอบว่าวารสารที่ต้องการนั้นถูกจัดเก็บอยู่ที่ใด

4) ให้ผู้ใช้บริการตรวจสอบว่าบทความที่ต้องการอยู่ในวารสารฉบับที่เท่าใด ถ้าเป็นฉบับที่มีข้อความว่า "ฉบับปัจจุบัน" ให้หยิบตัวเล่มได้ที่ชั้นวารสารใหม่สีส้ม ถ้ามีข้อความว่า "Arrived/ได้รับแล้ว" แสดงว่าเป็นวารสารล่วงเวลารอเย็บเล่ม ให้ติดต่อที่เคาน์เตอร์วารสารเพื่อยืมไปถ่ายสำเนาเอกสาร ถ้ามีข้อความว่า "Bound/เย็บเล่ม" ให้หยิบวารสารได้ที่ชั้นวารสารสีน้ำเงิน

ตัวอย่างของวารสารที่มีข้อความ "Bound/เย็บเล่ม"

3. การสืบค้นสื่อโสตทัศน์
เมื่อต้องการค้นหาสารสนเทศประเภท VCD DVD เทป วีดิโอ หรือชุดสื่อการสอนอื่นๆ สามารถสืบค้นได้จาก WebOPAC ใช้วิธีการและขั้นตอนเหมือนกับการสืบค้นหาหนังสือ แต่สถานที่จัดเก็บสื่อโสตทัศน์จะอยู่ที่ห้องบริการสื่อโสตทัศน์ชั้น 4 ดูประเภทของทรัพยากรและสถานที่จัดเก็บ

จากรูปตัวอย่างค้นหาเรื่อง Photoshop ให้คลิกเลือกรายการผลลัพธ์ที่ต้องการเพื่อตรวจสอบสถานภาพ จดเลขเรียก แล้วส่งให้กับเจ้าหน้าที่เพื่อดำเนินการยืมออก

ที่มาข้อมูล http://www.library.msu.ac.th/il/index.php?deftab=10

PangPong

วันอาทิตย์ที่ 6 พฤษภาคม พ.ศ. 2555

ความรู้เกี่ยวกับ search engine และ web opac

ไม่มีความคิดเห็น:

แสดงความคิดเห็น