مقاله سیستم مبتنی بر دانش برای کلاسبندی متن با الگوریتم ID6NB
این مقاله یک الگوریتم جدید به نام ID6NB را برای توسعه درخت تصمیم ، معرفی میکند که شامل الگوریتم ID3غیر افزایشی Quinlanاست. این الگوریتم راهحلهایی برای دو مشکل ذیل ارائه میکند: وضعیتی که در آن رای گیری اکثریت تصمیم نادرست میدهد (یعنی ساخت دو نوع قانون متفاوت برای داده یکسان.) کاهش ابعاد در الگوریتم غیر افزایشی درخت تصمیمگیری، تخمین صفت مناسب برای یک گره جایی که دو یا چند صفت بهره اطلاعاتی یکسانی دارند. مشکل اکثریت به کمک الگوریتم Naive Bayesحل میشود. برای کاهش ابعاد نیز یک راه حل ارائه شده است. در نهایت، دقت طبقه بندی به شدت بهبود یافته است. آزمایش گسترده و گسترش یافته در تعدادی از مجموعه دادههای واقعی و مصنوعی نشان میدهد که ID6NB یک الگوریتم دسته بندی state-of-the-art است که نسبت به سایر روشهای یادگیری درخت تصمیمگیری، خروجی بهتری دارد.
سیستم مبتنی بر دانش
تئوری اطلاعات و کلاس بندی
رخداد استثنا در کاهش ابعاد طول
حل و فصل رخداد استثنا در کاهش ابعاد
حل مسئله رد رای گیری برچسب کلاس جایی که رای گیری اکثریت با شکست مواجه می شود