วันจันทร์ที่ ๕ มีนาคม พ.ศ. ๒๕๕๐

HACK#9 เข้าใจใน URL ของ Google ให้มากขึ้น

ความเข้าใจใน URL ของ Google เอง จะทำให้คุณสามารถต่อยอดการสืบค้นได้ง่ายขึ้น

เมื่อนึกถึงการแฮ็กคุณอาจจะคิดถึงการสืบค้นที่ต้องใช้แบบฟอร์มหรือการสืบค้นที่มีรูปแบบซับซ้อน แต่จริงๆแล้วคุณสามารถค่อยๆทำการสืบค้นด้วยการค้นหาจาก URL ที่ได้จากการสืบค้นอีกทีหนึ่งก็ได้ ซึ่งวิธีนี้จะทำให้คุณสามารถทำการสืบค้นต่อไปได้ โดยที่ไม่ต้องเสียเวลากลับไปเลือกคำสั่งเพื่อปรับตัวเลือก (preferences) สำหรับการสืบค้นขั้นสูงอีกทีหนึ่ง

มารู้จักโครงสร้างของ URL กันเสียก่อน
สมมุติว่าคุณต้องการสืบค้นวลีว่า three blind mice ผลลัพธ์ของ URL ที่คุณได้นั้นอาจจะแตกต่างกันไปขึ้นอยู่กับตัวเลือก (preferences) ที่คุณได้กำหนดเอาไว้ แต่โครงสร้างของ URL โดยปกติจะมีหน้าตาดังนี้
http://www.google.com/search?num=100&hl=en&g=%22three+blind+mice%22

ส่วนที่ระบุถึงคำสั่ง คือ &g=%22three+blind+mice%22 สัญลักษณ์ %22 นั้นคือ รหัสของ URL ที่หมายถึงเครื่องหมายอัญประกาศ (“ ”) ซึ่งสามารถเข้าใจได้ค่อนข้างชัดเจน ต่อไปเราลองมาวิเคราะห์ดูส่วนอื่นกันบ้างดีกว่า

คำว่า num = 100 นั้นหมายถึง ผลของการสืบค้นต่อหนึ่งหน้า ในที่นี้คือ 100 รายการ ซึ่ง Google ยอมให้คุณระบุจำนวนที่ต้องการได้ตั้งแต่ 1 ถึง 100 รายการ การเปลี่ยนจำนวนผลลัพธ์ที่ต้องการในหนึ่งหน้าก็เป็นวิธีที่ดีวิธีหนึ่ง ที่จะจำกัดผลการสืบค้นของคุณ โดยที่ไม่ต้องวกกลับไประบุใหม่ที่หน้าจอของการสืบค้นขั้นสูงและทำการสืบค้นใหม่

หากคุณไม่พบคำว่า num = ใน URL ที่ได้ คุณอาจจะใส่เพิ่มเองได้ด้วยการเพิ่มลงไปใน URL และใส่ตัวเลขที่คุณต้องการ โดยตัวเลขอยู่ระหว่าง 1-100

  • Tip : คุณสามารถที่จะเพิ่มหรือเปลี่ยน modifier ด้วยการใส่เพิ่มลงใน URL หรือเปลี่ยนค่าของมันที่อยู่หลังเครื่องหมาย = ไปเป็นค่าอื่นที่อยู่ภายในช่วงที่กำหนดให้ได้

คำว่า hl = en หมายถึงภาษาที่ใช้ นั่นก็คือภาษาที่คุณใช้ใน Google ซึ่งจะเป็นภาษาที่ใช้ในโฮมเพจ ในข้อความต่างๆ หรือเป็นปุ่มคำสั่ง ในที่นี้คือภาษาอังกฤษ ในหน้า Language Tool Page) [Hack #2] นั้นจะมีตัวเลือกของภาษาให้มากมาย คุณสามารถที่จะคลิกเม้าส์เลือกดูได้และโปรดสังเกตดูผลที่เกิดกับ URL ด้วย เช่นเมื่อตัวเลือกของภาษาเป็น Pig latin จะให้ URL ดังนี้

http://www. Google .com/intl/xx-piglatin/

Modifier สำหรับภาษาจะอยู่ระหว่าง intl/ และเครื่องหมาย/สุดท้าย ซึ่งในที่นี้คือ xx-piglatin หรือคุณสามารถที่จะใส่ใน URL เอง ด้วยรูปแบบดังนี้
hl=xx-piglatin

จะเกิดอะไรขึ้นหากคุณใส่ &hl หลายๆ คำลงใน URL ที่ได้ คำตอบคือในกรณีที่มี modifier หลายตัว Google จะเลือกตัวสุดท้ายก่อน หมายความว่าคุณสามารถที่จะเพิ่ม modifier ตัวใหม่ต่อท้ายไปได้เรื่อยๆก็ได้ แทนที่จะต้องมานั่งแก้ไข modifier ที่ระบุไปแล้ว
ยังมี modifier อีกสองสามคำ ซึ่งเมื่อนำมาใช้ใน URL แล้ว อาจจะช่วยให้เกิดประโยชน์กับการค้นหาของคุณมากขึ้น เช่น

as_qdr=mx

modifier ตัวนี้จะระบุช่วงอายุของข้อมูลที่คุณต้องการค้นหาเป็นจำนวนเดือน โดยที่ x จะแทนหมายเลขตั้งแต่ 1 ถึง 12 แต่ขอแนะนำว่า ระบุตั้งแต่ 1 ถึง 6 เดือนจะดีที่สุด

safe=off

หมายถึงการปิด (disable) SafeSearch ซึ่ง SafeSearch จะกำจัดผลการค้นหาที่เกี่ยวกับเรื่องทางเพศออกไปก่อน ส่วน safe = on หมายถึงการกำหนดให้ใช้ SafeSearch

ดูเหมือนว่ากฎการแฮ็ก URL ของ Google อาจเป็นวิธีที่สร้างสรรค์ที่จะทำให้ได้ผลลัพธ์อย่างง่ายๆ

ยิ่งไปกว่านั้นมันยังทำให้การโหลดข้อมูลทำได้อย่างรวดเร็วขึ้นกว่าการโหลดจากแบบฟอร์มการสืบค้นขั้นสูงอีกด้วย เช่นในกรณีของการระบุช่วงอายุของข้อมูล มันคือวิธีเดียวที่จะทำให้ได้ข้อมูลกลุ่มที่ต้องการ

ไม่มีความคิดเห็น: