ده مقاله فارسی درباره پردازش زبان طبیعی (water mark)
1-شناسایی و تحلیل واژگان عمومی در منابع وب: رویکردی نو به بسط عبارات جستوجو با استفاده از زبان طبیعی در موتورهای کاوش (همایش انجمن کتابداری و اطلاع رسانی ایران)
چکیده: بازیابی اطلاعات دقیق و مرتبط همواره از اهمیت ویژه ای در پژوهش های حوزه بازیابی اطلاعات برخوردار بوده است. مقاله حاضر رویکردی جدید را در این زمینه معرفی و تجربه کرده است. بسط جستجو با استفاده از واژه های عمومی که همراه کلیدواژه های موضوعی در منابع و متون موجود در وب ظاهر میشوند می تواند موجب افزایش میزان دقت و ربط د رنتایج بازیابی در موتور های کاوش شود. به این منظور پژوهشی در دو مرحله انجام گرفت. در مرحله نخست، تعداد 800 صفحه وب با استفاده از روش تحلیل محتوا مورد بررسی قرار گرفت و واژه های عمومی همراه هر کلید وازه موضوعی شناسایی شد (جمعا 4264 مورد). نتایج تحلیل آماری نشان داد که 14.5 % از واژه های عمومی میان دو حوزه مشترک هستند، یعنی عمومی مطلق به شمار می آیند، 85.5 % واژه های عمومی وابسته به وزه عمومی می باشند. 65 % واژه های عمومی پیش و 35% از آنها پس از کلیدوازه های موضوعی در متون ظاهر می شوند. همچین از نظر نوع واژه ها 62.4 % غیر موضوعی 37.6% نیمه موضوعی به شمار می آید.
کلید واژه ها: بسط جستوجو، بازیابی اطلاعات در وب، زبان جستوجو، واژگان عمومی، موتور های کاوش
2-تعیین احساس از روی متن فارسی
چکیده: در بسیاری از کاربرد های تبدیل متن به گفتار بیهتر است تا مشخصات گفتار تولید شده هر چه بیشتر شبیه انسان باشد.برای این کار باید متنی که توسط سیستم ادا میشود. از لحاظ معنایی بررسی شود. یکی از مهمترین این ویژگی های معنایی احساس حاکم بر متن است. در زمینه تعیین احساس از روی متن کار های مختلفی در زبان انگلیسی صورت گرفته است. اما کمتر کسی اقدام به کار بر روی پیکره های فارسی کرده است. در این مقاله پیکره ای شامل 3702 جملخ از 6 کلاس احساس خوشحالیف عصبانیت، خنثی، ناراحتی، تنفر و ترس تهییه شده است. و روش های گوناگونی جهت تعیین احساس از روی یک جمله متنی به زبان فارسی به کار گرفته شده است. با بررسی نتایج بدست آمده متوجه میشویم که عملکرد برنامه در صورت استفاده از رویکرد مبتنی بر پیکره مطلوب است و دارای حداکثر دقت 78/85% و زمان بسیار کوتاه آموزش می باشد.
کلید واژه ها: پردازش زبان طبیعی، مدل زبانی، تحلیل معنایی، یادگیری ماشین، complement naive bayes
3-نگرشی جدید به تحلیل عبارت های اسمی هم مرجع
چکیده: پردازش زبان طبیعی شامل وظایفی همچون استخراج اطلاعات ، خلاصه سازی متن، پرشس و پاسخ می باشد که همگی نیاز دارند تا تمام اطلاعاتی که در مورد یک موجودیت در متن وجود دارد را شناسایی نماید. بنابراین وجود سیستمی که بتواند موضوع تحلیل عبارت های اسمی هم مرجع را بررسی نماید . کمک شایانی به انجام موفقیت آمیز این وظایف خواهد نمود. ما در این مقاله سعی داریم تا به طور دقیق فرایند تحلیل مرجع مشترک را بررسی نماییم. در همین راستا نیز فرآیند مشابه دیگری تحت عنوان تحلیل پیشایند را نیز مطالعه خواهیم نمود. امید داریم تا با بررسی این فرآیند و مقایسه ی شباهت ها و تفاوت ها ی آنها، به نگرشی جدید در مورد تحلیل عبارت های اسمی هم مرجع برسیم.
کلمات کلیدی: پردازش زبان طبیعی، استخراج اطلاعات، تحلیل مرجع مشترک، تحلیل پیشایند
4- ایجاد و انتشار زیر ساخت وب معنایی برای قرآن کریم
چکیده: زبان شناسی رایانه ای در سال های اخیر به یکی از دقدقه های اساسی محققان و پژوهشگران حوزه کامپیوتر و زبان شناسی تبدیل شده است. استفاده از رایانه و ابزار های هوشمند باعث شده است که بتوان بسیاری از کارهای مرتبط با پردازش متن را با سرعت بالا و دقت قابل توجهی انجام داد. پردازش زبان طبیعی در حوزه متن به پردازش پیکره های متنی در واقع نمادی از زبان هستند که با هدف خاصی تولید گردیده است می توان با تحلیل آنها به استخراج اجزا قواعد و ساز و کار زبان پی برد و در مرحله بعد با فناوری و غنی سازی متون و یا بکار گیری فناوری های رایانه ای محیط پژوهشی مناسبی را در ارائه محتوای این متون به گونه ای کارآمد ایجاد نمود.
کلید وازه ها: پردازش زبان طبیعی، پیکره، وب معنایی، قرآن کریم، RDF
5-بررسی روشهای متن کاوی درحوزه یادگیری الکترونیکی به منظور ارائه مدلی جهت استخراج اطلاعات
نوشتن دیدگاه