مقاله پژوهشی
بهروز محمودی بختیاری؛ علی فارسی نژاد
دوره 8، شماره 30 ، مهر 1391، صفحه 5-19
چکیده
امروزه در نتیجه مطالعات سازمانیافته بر پیکرههای گوناگون زبانی، جامعهشناسان زبان و متخصصان تحلیل گفتمان بر این باورند که سبک و نحوه استفاده زبان در زنان و مردان متفاوت است. با وجود این، هنوز تفاوت متون داستانی نویسندگان زن و مرد به طور دقیق به لحاظ علمی و آماری تحلیل نشده است. در این مقاله به منظور دستیابی به نتایج آماری و استفاده ...
بیشتر
امروزه در نتیجه مطالعات سازمانیافته بر پیکرههای گوناگون زبانی، جامعهشناسان زبان و متخصصان تحلیل گفتمان بر این باورند که سبک و نحوه استفاده زبان در زنان و مردان متفاوت است. با وجود این، هنوز تفاوت متون داستانی نویسندگان زن و مرد به طور دقیق به لحاظ علمی و آماری تحلیل نشده است. در این مقاله به منظور دستیابی به نتایج آماری و استفاده از رایانه در تحلیل سبکی نگارش مردان و زنان، ابتدا پیکره کوچکی از داستانهای نویسندگان زن و مرد (به زبان انگلیسی) تهیه شد. سپس این پیکره در دو سطح عمومی/ واژگانی و مقوله دستوری، با استفاده از روشهای پردازش زبان طبیعی، از شمارش ساده واحدهای زبانی تا روشهای آماری، واکاوی شد. نتایج این پژوهش نشان میدهد که از میان شاخصهای معرفی شده برای مقایسه سبک نوشتاری زنان و مردان، نویسندگان زن از کلمات مربوط به خانواده، کلمات منفی و حرف اضافه«for»استفاده بیشتری میکنند. این مقاله، گام نخست در مسیری است که امید میرود با تهیه پیکرههای داستانی فارسی، در مطالعات سبکشناسی آثار معاصر ایران نیز پیگیری شود.
مقاله پژوهشی
نسرین براتعلی پور؛ هشام فیلی؛ آزاده شاکری
دوره 8، شماره 30 ، مهر 1391، صفحه 21-36
چکیده
پیکرههای موازی یکی از منابع با ارزش در بسیاری از کاربردهای پردازش زبان طبیعی و همچنین بازیابی هوشمند اطلاعات بینزبانی است. لازمه استفاده از این پیکرهها همترازی آنها در سطح جمله است، اما جمعآوری و یا تولید این پیکرهها و همچنین همترازی آنها بسیار پرهزینه است. با توجه به گستردگی و قابلیت دسترسی رایگان صفحات وب دوزبانه، جمعآوری ...
بیشتر
پیکرههای موازی یکی از منابع با ارزش در بسیاری از کاربردهای پردازش زبان طبیعی و همچنین بازیابی هوشمند اطلاعات بینزبانی است. لازمه استفاده از این پیکرهها همترازی آنها در سطح جمله است، اما جمعآوری و یا تولید این پیکرهها و همچنین همترازی آنها بسیار پرهزینه است. با توجه به گستردگی و قابلیت دسترسی رایگان صفحات وب دوزبانه، جمعآوری پیکرههای موازی از وب و همترازی آنها به صورت خودکار بسیار مطلوب است. در این مقاله برای تولید جملات موازی، ابتدا صفحات وب حاوی جملات موازی انتخاب، سپس ویژگیهای هر زوج جمله فارسی-انگلیسی در این صفحات محاسبه و در نهایت به کمک طبقهبند بیشترین پراکندگی جملات موازی استخراج میشود. یکی از ویژگیهای جملات استخراج شده، وابسته نبودن به دامنه و امکان پوشش حوزههای متفاوت معنایی است.
مقاله پژوهشی
پریا جمشیدلو؛ محمد بحرانی
دوره 8، شماره 30 ، مهر 1391، صفحه 37-51
چکیده
درک زبان محاوره حوزۀ خاصی از درک زبان طبیعی را شامل میشود که در آن جملات بیانشده توسط کاربر به اندازۀ جملات زبان نوشتاری تابع دستور زبان نیستند. در این مقاله، سامانه محاورۀ مبتنی بر متن برای استخراج معنای جملات محاورهای مربوط به حوزۀ ذخیره بلیت معرفی میشود. در طراحی این سامانه از شیوههای مبتنی بر داده استفاده شده است. معماری ...
بیشتر
درک زبان محاوره حوزۀ خاصی از درک زبان طبیعی را شامل میشود که در آن جملات بیانشده توسط کاربر به اندازۀ جملات زبان نوشتاری تابع دستور زبان نیستند. در این مقاله، سامانه محاورۀ مبتنی بر متن برای استخراج معنای جملات محاورهای مربوط به حوزۀ ذخیره بلیت معرفی میشود. در طراحی این سامانه از شیوههای مبتنی بر داده استفاده شده است. معماری آن شامل دو بخش اصلی استخراج متغیرها و انتساب محتملترین برچسبهای معنایی به دنبالهای از کلمات است. برای این کار از الگوی مخفی مارکوف استفاده میشود. برچسبزنی معنایی دنبالۀ کلمات با استفاده از الگوریتم ویتربی صورت میگیرد. بدین منظور، ابتدا پیکرهای از جملاتِ مورد استفاده در حوزۀ ذخیره بلیت جمعآوری و سپس به هر کلمه یا ترکیبی از کلمات یک برچسب معنایی تخصیص داده میشود. در مرحلۀ آموزش با استفاده از پیکرۀ برچسبخورده، دنبالۀ برچسبهای ممکن برای توالی کلمات مختلف یاد گرفته میشود. در مرحلۀ آزمون با استفاده از احتمالات استخراجشده از مرحلۀ آموزش، محتملترین برچسب معنایی برای هر کلمه یا ترکیبی از کلمات پیدا میشود. بر اساس آزمایشهای انجامشده، دقت سامانه پیشنهادی در تشخیص سه برچسب کلیدیِ مبدأ، مقصد و تاریخ 91 درصد است.
مقاله پژوهشی
مهرنوش شمس فرد؛ فاطمه جعفری نژاد
دوره 8، شماره 30 ، مهر 1391، صفحه 53-71
چکیده
به دست آوردن روابط معنایی میان افعال و دیگر اجزای سازندۀ جمله برای پردازش معنایی جمله کاربرد بسیاری دارد. به علاوه اطلاع از محدودیتهای گزینشی که فعل به وابستههای خود اعمال میکند نیز در پردازش معنایی کاربرد دارد. علی رغم اینکه تلاش برای این کار در زبانهای مختلف در حال پیگیری است، فراهم ساختن چنین اطلاعاتی برای افعال به صورت ...
بیشتر
به دست آوردن روابط معنایی میان افعال و دیگر اجزای سازندۀ جمله برای پردازش معنایی جمله کاربرد بسیاری دارد. به علاوه اطلاع از محدودیتهای گزینشی که فعل به وابستههای خود اعمال میکند نیز در پردازش معنایی کاربرد دارد. علی رغم اینکه تلاش برای این کار در زبانهای مختلف در حال پیگیری است، فراهم ساختن چنین اطلاعاتی برای افعال به صورت دستی مستلزم صرف هزینههای انسانی و زمانی است. در نتیجه خودکارسازی این روند بسیار با اهمیت و مورد توجه پژوهشگران است. در این مقاله سه روش برای استخراج این روابط معنایی ارائه میشود. روش مبتنی بر ریختشناسی و تحلیلهای لغوی به صورت ساده شدهای به حل مسئله میپردازد. روش مبتنی بر تعمیم، با بررسی آماری وابستههای افعال به محدودیتهای گزینشی دست مییابد؛ و در روش مبتنی بر قاعده و تعمیم، برچسبزنی نقشهای معنایی و یافتن محدودیتهای گزینشی افعال به یافتن وابستهها منجر میشود. در انتها این روشها با هم مقایسه و مزایا و معایب هر یک بررسی میشود.
مقاله پژوهشی
هادی عبدی قویدل؛ افشین رحیمی؛ پروانه خسروی زاده
دوره 8، شماره 30 ، مهر 1391، صفحه 73-84
چکیده
مقاله حاضر به معرفی سامانهای با عنوان سایهنما میپردازد. ایدۀ کلی این سامانه که در زمینه استعاره برای زبان فارسی است برای نخستین بار طرح و پیادهسازی میشود. سایهنما با هدف کمک به درک استعاره به صورت خودکار، عملیات یافتن ویژگیهای معنایی مشترک بین دو واژهای که در بافت استعاری حضور دارند انجام میدهد. فرایند کلی سایهنما ...
بیشتر
مقاله حاضر به معرفی سامانهای با عنوان سایهنما میپردازد. ایدۀ کلی این سامانه که در زمینه استعاره برای زبان فارسی است برای نخستین بار طرح و پیادهسازی میشود. سایهنما با هدف کمک به درک استعاره به صورت خودکار، عملیات یافتن ویژگیهای معنایی مشترک بین دو واژهای که در بافت استعاری حضور دارند انجام میدهد. فرایند کلی سایهنما بدین ترتیب است که نخست ویژگیهای معنایی مشترک بر اساس اطلاعات نقطهای مشترک در همرخدادی مرتبه دوم استخراج و در پی آن صفاتی معرفی میشوند تا بتوانند این نوع ویژگیها را توصیف کنند. کاربرد این روش در سامانههای درک متن و به خصوص درک استعاره به صورت خودکار، کارایی سامانه را به طور قابل توجهی بهبود میدهد.
مقاله پژوهشی
شهرام مدرس خیابانی
دوره 8، شماره 30 ، مهر 1391، صفحه 85-105
چکیده
چرچ و دیگران (1991: 12-13) با معرفی برخی ابزار آماری همچون «آزمون اطلاعات دوسویه» و «آزمون تی»، اهمیت چنین ابزاری را در تحلیلهای زبانشناختی نشان میدهند. از سوی دیگر لاینز (1995: 62) تفاوت در باهمآیندهای دو واژة «big» و «large» را از دلایل نبود هممعنایی مطلق میان این دو واژه برمیشمارد. در این مقاله سعی بر آن است تا با ...
بیشتر
چرچ و دیگران (1991: 12-13) با معرفی برخی ابزار آماری همچون «آزمون اطلاعات دوسویه» و «آزمون تی»، اهمیت چنین ابزاری را در تحلیلهای زبانشناختی نشان میدهند. از سوی دیگر لاینز (1995: 62) تفاوت در باهمآیندهای دو واژة «big» و «large» را از دلایل نبود هممعنایی مطلق میان این دو واژه برمیشمارد. در این مقاله سعی بر آن است تا با استفاده از دو ابزار ذکرشده، ضمن اشاره به اهمیت پیکرههای زبانی و ابزار آماری در پژوهشهای زبانشناختی، تفاوت واژههای هممعنی از منظر باهمآیی بررسی شود.
مقاله پژوهشی
وحید مواجی؛ محرم اسلامی
دوره 8، شماره 30 ، مهر 1391، صفحه 107-118
چکیده
گونة رسمی و گونة محاورهای زبانها غالباً تفاوتهایی با هم دارند و این تفاوتها در همة سطحهای زبانی دیده میشود. میزان تفاوت بین گونة رسمی و گونة محاورهای، که گاهی از آنها با عنوان تفاوت گفتار و نوشتار یاد میشود، از زبانی به زبان دیگر متفاوت است. زبان فارسی از جملة زبانهایی است که در آن تفاوت گونة رسمی و گونة محاورهای ...
بیشتر
گونة رسمی و گونة محاورهای زبانها غالباً تفاوتهایی با هم دارند و این تفاوتها در همة سطحهای زبانی دیده میشود. میزان تفاوت بین گونة رسمی و گونة محاورهای، که گاهی از آنها با عنوان تفاوت گفتار و نوشتار یاد میشود، از زبانی به زبان دیگر متفاوت است. زبان فارسی از جملة زبانهایی است که در آن تفاوت گونة رسمی و گونة محاورهای بسیار زیاد است. در این تحقیق تفاوتهای آوایی یا به عبارتی فرایندهای آواییای بررسی میشود که در زبان فارسی در تبدیل گونة رسمی به گونة محاورهای رخ میدهد. پیکره پژوهش حاضر دادگان گفتاری «فارسدات تلفنی» زبان فارسی(بیجنخان و همکاران، 2003) است که در آن گفتار پیوسته در دو سطح واجی و آوایی در قالب دو زنجیرة مستقل برچسب خورده است. همگذاری این دو رشته از دادهها روشن میسازد که در مقایسة این دو گونة زبانی کدام فرایندهای آوایی در تبدیل زنجیرة واجی به زنجیرة آوایی دخیلاند. در انطباق دو رشتة واجی و آوایی از الگوریتم لونشتاین استفاده میشود که مناسب و رایج در انطباق تقریبی رشتههای متفاوت جهت یافتن فاصلة بین آنها است. در نتیجه تفاوت دو رشتة واجی و آوایی به صورت آماری به دست میآید. از نتایج این پژوهش میتوان به لحاظ نظری در توصیفهای زبانشناختی درباره نظام آوایی زبان فارسی، تهیة منابع محاورهای زبان فارسی و آموزش زبان فارسی به خصوص به غیرفارسیزبانان سود جست. از سوی دیگر در فنآوریهای گفتار مانند بازشناسی و بازسازی گفتار، استخراج اطلاعات از متنهای محاورهای، تبدیل متن به زنجیرة واجی گونة محاورهای زبان فارسی و امکان تبدیل آن به گونة رسمی میتوان از نتایج این تحقیق استفاده کرد.