¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡ ¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡
¸»¹¶Ä¡·ÎºÎÅÍ ÃßÃâµÈ Åë°è Á¤º¸¸¦ È°¿ëÇÑ Çѱ¹¾î º¹ÇÕ¸í»ç
A Korean Revision System Using the governal and collocational relation between words
俵¼÷, ±ÇÇõö*
* ÀÚ¿¬°úÇдëÇÐ ÀüÀÚ°è»êÇаú(ÀΰøÁö´É, ÀÚ¿¬¾ð¾îó¸®)
¿ä¾à
º» ³í¹®Àº Á¤º¸ °Ë»öÀ̳ª ±â°è ¹ø¿ª°ú °°Àº ÀÚ¿¬ ¾ð¾î ó¸® ÀÀ¿ë ºÐ¾ß¿¡¼­ ÀÚÁÖ °Å·ÐµÇ´Â º¹ÇÕ¸í»çÀÇ °áÇÕ °ü°è¸¦ ±Ô¸íÇÏ¿© ±¸Á¶·Î ÀÎÇØ ¹ß»ýÇÏ´Â ÁßÀǼº ÇØ°áÀ» ¸ñÀûÀ¸·Î ÇÑ´Ù. ¸»¹¶Ä¡·ÎºÎÅÍ ÃßÃâµÈ ¸í»çµé°£ÀÇ ºÐ¸® Á¤º¸(Segment Information)¿Í »óÈ£ Á¤º¸(Mutual Information) ±¸ÃàÀ» ÅëÇØ º¹ÇÕ¸í»çÀÇ ºÐÇØ ¹× ÇÕ¼º °úÁ¤¿¡¼­ ¹ß»ýÇÏ´Â ±¸Á¶¿¡ µû¸¥ °áÇÕ °ü°è¸¦ ºÐ¼®, ÆÇ´ÜÇÑ´Ù. Áï, ´ÜÀ§¸í»ç°¡ ºÐ¸®µÇ´Â À§Ä¡¿¡ µû¸¥ ºÐ¸® Á¤º¸¿Í µÎ ´ÜÀ§ ¸í»çÀÇ °áÇÕ Á¤µµ¸¦ ³ªÅ¸³»´Â »óÈ£ Á¤º¸ Åë°èÄ¡¸¦ ÀÌ¿ëÇØ º¹ÇÕ¸í»çÀÇ Åë»çÀû °áÇÕ ±¸Á¶¸¦ »ìÆì º¸´Â °ÍÀÌ´Ù. ½Ã½ºÅÛ ±¸ÃàÀ» À§ÇØ »ç¿ëµÈ ¸»¹¶Ä¡´Â 3³âÄ¡ 6°³ ÀÏ°£ÁöÀÇ Á¤Ä¡, °æÁ¦¸éÀ» ´ë»óÀ¸·Î ÇÏ¿© 300,000¾îÈÖ Á¤µµÀÇ º¹ÇÕ¸í»ç »çÀüÀ» ±¸ÃàÇÏ¿´°í, ½ÇÇèÀ» Çϱâ À§ÇØ »ç¿ëµÈ ¸»¹¶Ä¡´Â 6°³¿ù ºÐ·®ÀÇ ºÎ»êÀϺ¸ Á¤Ä¡, °æÁ¦¸é¿¡¼­ ÃßÃâµÈ º¹ÇÕ¸í»ç·Î¼­ ¾à 412,773¾îÀýÀÌ´Ù. ¼¼ °³ÀÇ ´ÜÀ§ ¸í»ç·Î ±¸¼ºµÈ º¹ÇÕ¸í»çÀÇ °áÇÕ ±¸Á¶¸¦ ºÐ¼®ÇÑ °á°ú µÎ ¹ø°, ¼¼ ¹ø° ¸í»ç°¡ Á߽ɾ µÇ´Â ±¸Á¶°¡ 62.87%·Î ³ªÅ¸³ª¸ç, »öÀξîÀÇ À¯ÇüÀº ¼¼ °³ÀÇ ´ÜÀ§ ¸í»ç·Î ±¸¼ºµÈ º¹ÇÕ¸í»çÀÇ °æ¿ì´Â ´Ü ÇϳªÀÇ º¹ÇÕ¸í»ç¸¸ÀÌ ¾Æ´Ï¶ó 90.13%°¡ ³× °¡Áö Á¾·ùÀÇ ¸í»ç°¡ »öÀξî·Î äÅÃµÉ ¼ö ÀÖÀ½À» º¸¿©ÁØ´Ù.

¾îÀý °£ ¿¬°ü °ü°è¸¦ ÀÌ¿ëÇÑ Çѱ¹¾î ¹®¹ý °Ë»ç±â
±èÇöÁø, ±ÇÇõö*
* ÀÚ¿¬°úÇдëÇÐ ÀüÀÚ°è»êÇаú(ÀΰøÁö´É, ÀÚ¿¬¾ð¾îó¸®)
Abstract
Áö±Ý±îÁöÀÇ Çѱ¹¾î öÀÚ °Ë»ç/±³Á¤±â´Â ÇÑ ¾îÀý ³»ÀÇ Ã¶ÀÚ¹ý ¿À·ù¿Í ÀÔ·Â ¿À·ù µîÀ» ó¸®ÇÏ¿´´Ù. ±×·¯³ª Çѱ¹¾î ¹®¼­¿¡´Â ¿©·¯ ¾îÀýÀ» °ËÁõÇؾ߸¸ ó¸®ÇÒ ¼ö ÀÖ´Â ÀÇ¹Ì ¿À·ù¿Í ¹®Ã¼ ¿À·ù°¡ ¸¹ÀÌ ÀÖ´Ù. ÀÌ·± Àǹ̳ª ¹®Ã¼ ¿À·ù¸¦ ó¸®Çϱâ À§Çؼ­´Â ÀÇ¹Ì ºÐ¼®À» ÇؾßÇϳª, ÇöÀçÀÇ ±â¼ú·Î´Â ÇÑ°èÁ¡ÀÌ ¸¹´Ù. ±×·¡¼­ ÀÌ ³í¹®¿¡¼­´Â ¾îÀý °£ÀÇ ¿¬°ü °ü°è¿Í ÀÌ ¿¬°ü °ü°è¸¦ ÀνÄÇϱâ À§ÇØ ºÎºÐÀû ¹®¹ý °ü°è¸¦ Àû¿ëÇÑ Çѱ¹¾î ¹®¹ý °Ë»ç±â¸¦ Á¦¾ÈÇÑ ´Ù. Çѱ¹¾î ¹®¼­¿¡¼­ ¸¹ÀÌ ³ªÅ¸³ª´Â ¿À·ù¸¦ ºÐ·ùÇؼ­ ÀÌ°ÍÀ» ±ÔÄ¢º£À̽ºÈ­ÇÑ´Ù. ±×¸®°í ÀÌ·¯ÇÑ ¿À·ù¸¦ È¿À²ÀûÀ¸·Î °ËÁõÇϱâ À§ÇØ 'µ¥¸ó ÇÁ·Î±×·¡¹Ö'À» ÀÌ¿ëÇÑ´Ù. ±âÁ¸ öÀÚ °Ë»ç/±³Á¤±â°¡ ÇüÅÂ¼Ò ´ÜÀ§ ºÐ¼® ±â¹ýÀ» ÀÌ¿ëÇÏ¿´´Ù¸é ÀÌ ³í¹®¿¡¼­ Á¦¾ÈÇÑ ¹æ½ÄÀº ¹®Àå ´ÜÀ§ÀÇ ºÐ¼® ±â¹ýÀ¸·Î ¹ßÀüÇÏ´Â °úÁ¤À̶ó ÇÒ ¼ö ÀÖ´Ù.
Çѱ¹¾î Á¤º¸°Ë»ö ½Ã½ºÅÛÀ» À§ÇÑ ´Ù¾çÇÑ ÀûÇÕ¼º Çǵå¹é ¹æ¹ý
¹Ú¼öÇö, ±ÇÇõö*
µ¿¼­ ´ëÇб³ Á¤º¸ ½Ã½ºÅÛ ÇкΠÄÄÇ»ÅÍ°øÇÐ Àü°ø,
*ÀÚ¿¬°úÇдëÇÐ ÀüÀÚ°è»êÇаú(ÀΰøÁö´É, ÀÚ¿¬¾ð¾îó¸®)
Abstract
Á¤º¸°Ë»ö ½Ã½ºÅÛÀÇ °Ë»ö È¿À² Çâ»óÀ» À§Çؼ­ ´Ù¾çÇÑ ÀûÇÕ¼º Çǵå¹é ¹æ¹ýÀÌ °³¹ßµÇ¾ú´Ù. ±×·¯³ª Çѱ¹¾î Á¤º¸°Ë»ö ½Ã½ºÅÛÀ» À§ÇÑ ÀûÇÕ¼º Çǵå¹é¿¡ ´ëÇÑ ¿¬±¸´Â °ÅÀÇ ÀÌ·ç¾îÁöÁö ¾ÊÀº ½ÇÁ¤ÀÌ´Ù. ÀÌ ³í¹®¿¡¼­´Â ±âÁ¸¿¡ °³¹ßµÈ ÀûÇÕ¼º Çǵå¹é ¹æ¹ýÀ» Çѱ¹¾î Á¤º¸°Ë»ö ½Ã½ºÅÛ¿¡ Àû¿ëÇÏ¿© °Ë»ö È¿À²À» ºñ±³ÇÏ°í, »õ·Î¿î ÀûÇÕ¼º Çǵå¹é ¹æ¹ýÀ» °³¹ß Àû¿ëÇÏ¿© ±âÁ¸ÀÇ ¹æ¹ýµé°ú °Ë»ö È¿À²À» ºñ±³ ºÐ¼®ÇÏ¿´´Ù. ÀûÇÕ¼º Çǵå¹éÀº ¿øÁúÀǹ®À» È®ÀåÇÒ ´Ü¾î ¼±Åðú ¼±ÅÃµÈ ´Ü¾î °¡ÁßÄ¡ ºÎ¿©·Î ÀÌ·ç¾îÁø´Ù. ¿øÁúÀǹ®ÀÌ ÀÔ·ÂµÇ¸é °Ë»öµÈ ÀûÇÕ¹®¼­¿¡¼­ ¿øÁúÀǹ®ÀÇ ´Ü¾î¿Í ¹ÐÁ¢ÇÑ °ü°è°¡ ÀÖ´Â ´Ü¾î¸¦ ¼±ÅÃÇÏ¿© °¡ÁßÄ¡¸¦ ºÎ°¡ÇÑ ÈÄ, ¿øÁúÀǹ®¿¡ Ãß°¡ÇÏ¿© ÁúÀǹ®À» È®ÀåÇÑ´Ù. ÀÌ ³í¹®¿¡¼­´Â ¿øÁúÀǹ® È®ÀåÀ» À§ÇÑ ´Ü¾î ¼±Åðú ´Ü¾î °¡ÁßÄ¡ ºÎ¿©¸¦ À§ÇØ 3°¡Áö °ªÀ» »ç¿ëÇÑ´Ù. ù°, TF´Â ÀûÇÕ¹®¼­ ³»ÀÇ ´Ü¾î ºóµµÀÇ ÃÑÇÕÀÌ´Ù. µÑ°, idf ´Â ÇØ´ç ¹®¼­Áý´ÜÀÇ ¿ª¹®ÇåºóµµÀÌ´Ù. ¼Â°, r/RÀº °Ë»öµÈ ÀûÇÕ¹®¼­ Áß¿¡¼­ ÇØ´ç ´Ü¾î°¡ ÀÖ´Â ÀûÇÕ¹®¼­ÀÇ ºñÀ²À» ³ªÅ¸³½´Ù. TF¿Í idf´Â Á¤º¸°Ë»ö ½Ã½ºÅÛ¿¡¼­ ÀϹÝÀûÀ¸·Î »ç¿ëµÇ´Â °ªÀÌ°í r/RÀº ÀÌ ³í¹®¿¡¼­ Á¦¾ÈÇÑ »õ·Î¿î °ªÀÌ´Ù.


Pusan National University Artificial Intelligence Laboratory.
webmaster@bandi.cs.pusan.ac.kr