پاورپوینت برچسب گذاری اجزای کلام زبان فارسی (pptx) 24 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 24 اسلاید
قسمتی از متن PowerPoint (.pptx) :
بنام خدا
1
برچسب گذاری اجزای کلام زبان فارسی
یادآوری
هدف
/PRPمن /JDترجیح /VBمیدهم /TOتا /INدر /DTیک /NNکتابخانه /JJدانشگاهی /JDمطالعه /VBکنم
روشها
ارزیابی
3
فهرست مطالب
4
مشکلات برچسب گذاری
ساختواژه فارسي و كلمات
وندها مانند نشانه جمع، ضمایر ملکی، کسره اضافه و ...
کتابــهــایـــم
ساختواژه افعال
ابهام در ساختواژه
مردی: نکره ، شناسه دوم شخص
تشخيص كران كلمات
«کتابها»، «کتاب ها»، «کتابها»
5
تحلیلگر ساختواژی
ابهام زدایی از هم نگاره
تشخیص برچسب کلمه ناشناخته
برچسب گذاری
مدلی از پیاده سازی
6
کارهای انجام شده
اولين كار براي برچسب گذاري زبان فارسي
آسی و حاجی عبدالحسینی 2000
Megerdoomian 2004
Raja et al 2007
ارومچیان 2006 و 2007
(مرادزاده، 1383 )
(بي جن خان و مرادزاده، 1383 )
7
پیکره متنی زبان فارسی
چند نمونه پیکره
پیکره موازی زبان فارسی
همشهری
پیکره بی جن خان*
2.6 میلیون تگ دستی
4300 موضوع: حقوقي، سياسي، حسابداري، اقتصادي و ...
76706 واژه
8
برچسب های پیکره
دو نسخه
حدود 500 تا 600 برچسب
برچسبها در سه دسته
1 برچسب هاي نحوي –ساختواژي
اسم، فعل، صفت، قيد، حرف ربط، حرف اضافه، حرف
2 برچسب هاي خاص
ادات شرط، كيفيت نما، كلمه پرسشي، جمله واره، حرف ندا، منادي،
3 برچسب هاي متفرقه
جداكننده، علامت رياضي.
9