تعداد فزاینده ای از مردم برای یافتن اطلاعات در وب، موتورهای جستجوگر را به کار می گیرند. آنها به موتور های جستجوگری نیاز دارند تا اطلاعات مرتبط با آنچه را که می خواهند، در زمان کوتاهی در اختیارشان بگذارد. موتور های جستجوگر کنونی در وب، بر اساس کلمات کلیدی کار می کنند. این موتور های جستجوگر باید کلمات، عبارات و جملات را از میلیون ها صفحه وب استخراج و ایندکس کنند. بعضی اوقات مردم اطلاعات نامرتبطی را از جستجوهایشان دریافت می کنند. سایت ها و نرم افزار های تحت وب، داده های ساختاریافته (structured data) را که در دیتابیس های رابطه ای ذخیره شده اند، به یک فرمت بدون ساختار که در صفحات وب موجود است، تبدیل می کنند. موتورهای جستجوگر باید چنین صفحاتی را بررسی کنند. استخراج داده های ساختاریافته اولیه از چنین صفحاتی، کار مشکلی است. چند روش برای افزودن داده های ساختاریافته به صفحه وجود دارد به طوری که آنها را قابل خواندن توسط ماشین یا موتورهای جستجوگر کند. مشهورترین این روشها عبارتند از:
- RDFa
- Microformats
- Microdata
در این مقاله ضمن معرفی مختصر این روشها به مقایسه آنها می پردازم.
معرفی
مردم برای یافتن اطلاعات در وب به موتورهای جستجوگر نیاز دارند. زندگی کنونی مردم در بسیاری از جنبه های آن به استفاده از موتور های جستجوگر وابسته است. بنابراین یافتن اطلاعات مرتبط با چیزی که دنبال آن هستند در موتورهای جستوگر از اهمیت بسیاری برخوردار است. موتورهای جستجوگر در صفحات وب می خزند و سعی می کنند که داده های موجود در آنها را استخراج کنند. مردم از کلمات کلیدی برای جستجوی داده های مورد نظر خود استفاده می کنند. موتورهای جستجوگر فهرست بلندی از صفحات وبی که حاوی آن کلمات کلیدی هستند، ارائه می کنند. این نتایج ممکن است کاملا با موضوع مورد جستجوی مردم، متفاوت باشد. موتورهای جستجوگر حساس به واژگان هستند و باید آنها را از لابلای صفحات وبی استخراج کنند که با استفاده از تگ های HTML بدون هیچ معنی خاصی درست شده اند.
برای اینکه موتورهای جستجوگر مفیدتری برای مردم درست شود، ما باید صفحات وبی داشته باشیم که بیشتر از آنچه که هست، برای موتورها قابل خواندن باشند. به این منظور، مکانسیم هایی ایجاد شده اند تا با استفاده از تگ های ساده HTML، داده های ساختاریافته به صفحات وب به صورت متفاوتی افزوده شوند. این مکانیسم ها به تولید کنندگان محتوا برای وب کمک می کند تا داده های ساختار یافته را در صفحات خود مشخص بکنند. برای نمونه آنها بتوانند مشخص کنند که بخشی از محتوای صفحه حاوی اطلاعات مردم، رخدادها، راهنما، فیلم و ... است. مکانیسم های RDFa، Microformats و Microdata، معروف ترین این مکانیسم ها برای قرار دادن داده های ساختاریافته به صفحات وب هستند. هر یک از این تکنولوژی ها مزایا و معایب خاص خود را دارند که موضوع این مقاله است. در نهایت توصیه این مقاله استفاده از Microdata است.