/******************************************************************
Projectname: Automatic meta Generator
Version: 0.1
Author: saeed arab sheybani
Last modified: دوشنبه ۱۳۸۷/۸/۲۰
ضرورت دارد مورد زیر به این متاژن افزوده شود*
بخشهای فارسی آمده در آدرس صفحه *
شرح:
برای key
این کلاس بصورت خودکار کلمات کلیدی را از متن استخراج میکند
نحوه استخراج کلمات کلیدی
1- حذف کلمات معمول شامل حروف اضافه،ربط و افعال و موارد تعریف شده(و فیلتر شده)
2- حذف کلمات با حروف تکراری مانند tehhhfjrl
3- الویت دادن به کلمات از پیش تعریف شده بدون توجه به فراوانی در جمله(کلماتی مانند «آگهی»، «استخدام» و....)
4- اعمال برخی موارد هوشمند دیگر(مثلا نادیده گرفتن کلمات با فراوانی بالا که از تعداد حروف کمی با توجه به میزان فراوانی در جمله برخوردار هستند
5- در شرایط یکسان از نظر فراوانی اولویت دادن به کلمات بزرگتر(با حروف بیشتر)
و کلمات پرمصرف در زبان فارسی مانند حروف ربط و اضافه و همچنین افعال و... را در نظر نمی گیرد
مهمترین ویزگی این متاژن انتخاب کلماتی که حتما در متن قرار گرفته میباشد
و برای descroiton
متن مورد نظر را از تگ h انتخاب میکند
و در صورت نبودن تگ h از متنهای بولد یا مهم استفاده میکند
Change Log:
===========
0.1 Ver یکشنبه ۱۳۸۷/۸/۱۹
افزودن امکانات بیشتر از جمله قابلیت تشخیص کلمات معمول
================================
0.2 Ver سه شنبه ۱۳۸۷/۸/۲۱
افزودن استخراج description از متن
=========================================================
از جمله قابلیتهای که میتوان در آینده با این کلاس اضافه کرد
اتصال به بانک اطلاعاتی برای دریافت کلمات از پیش تعریف شده
******************************************************************/ |