پروپوزال داده کاوی در پزشکی (docx) 1 صفحه
دسته بندی : تحقیق
نوع فایل : Word (.docx) ( قابل ویرایش و آماده پرینت )
تعداد صفحات: 1 صفحه
قسمتی از متن Word (.docx) :
دانشکده آموزشهای الکترونیکی
پايان نامه كارشناسي ارشد در رشته مهندسی فناوری اطلاعات
(تجارت الکترونیک)
بهینه سازی خرید دارو با استفاده از دادهکاوی
به کوشش
محمد مهدی تورنجی
استاد راهنما:
دکتر رضا بوستانی
بهمن ۱۳۹3
به نام خدا
بهینه سازی خرید دارو با استفاده از داده کاوی
به وسیلهی :
محمد مهدی تورنجی
پایان نامه
ارائه شده به تحصیلات تکمیلی دانشگاه به عنوان بخشی از فعالیتهای تحصیلی لازم برای اخذ درجه کارشناسی ارشد
در رشتهی:
مهندسی فناوری اطلاعات – تجارت الکترونیک
از دانشگاه شیراز
شیراز
جمهوری اسلامی ایران
ارزیابی شده توسط کمیته پایاننامه با درجه :
دکتر .....................، استادیار بخش ..........................(رئیس کمیته) ...............................
دکتر .....................، استادیار بخش .....................................................................................
دکتر ....................، استادیار بخش ......................................................................................
بهمن ماه 1393
تقدیم به آنان که به من آموختتند
و تقدیم به خانواده و همسرم
که با شکیبایی و مهربانی در کنارم بودند...
سپاسگزاری
اکنون که این پایاننامه به پایان رسیده است بر خود لازم میدانم تا از زحمات بیدریغ استاد بزرگوارم جناب آقای دکتر رضا بوستانی که از آغاز تا پایان کار با راهنماییهای ارزشمند خود زمینه ساز پیشرفت پایاننامه شدند و در این راه زحمات فراوانی را بر دوش گرفتند، نهایت سپاس و قدردانی را داشته باشم.
همچنین از استاد بزرگوار، جناب آقای دکتر سید محمد رضا موسوی که به عنوان استاد مشاور در این پژوهش بنده را همراهی کردند سپاسگزارم.
صمیمانه از همراهی و همکاری دوستان و همکارانم در واحد فناوری اطلاعات بیمارستان پاستور و همچنین جناب آقای مهندس کلانی، خانم مهندس منصوره رضایی، خانم دکتر پریسا ایزدی، آقای دکتر حمید رضا صدیقی کمال تشکر و قدرانی را دارم.
چکیده
بهینه سازی خرید دارو با استفاده از داده کاوی
به کوشش
محمد مهدی تورنجی
توسعهی استفاده از فناوری اطلاعات در بهداشت و درمان علاوه بر مزایای فراوان باعث می شود تا حجم زیادی از دادههای مرتبط، در دسترس قرار بگیرند. با بکارگیری داده کاوی بر روی داده های موجود می توان تصمیم گیریها و فرایندهای مدیریتی را بهبود بخشید. در این پایان نامه تلاش شده است ضمن بررسی الگوریتمهای مختلف داده کاوی مدلی جهت پیش بینی مصرف دارو در داروخانههای بیمارستانها ارائه گردد. مجموعه داده در نظر گرفته شده مربوط به سیستم اطلاعات بیمارستان پاستور شهرستان بم می باشد که در مدت 5 سال در پایگاه داده سیستم اطلاعات این بیمارستان ذخیره شده است. برای پیش بینی مصرف دارو عملکرد مدلهای MLP، SVR، ADABOOST.R، BAGTREE، LR، LSSVR مورد بررسی قرار می گیرد. دقت پیش بینی بر اساس معیارها MSE ,RMSE ,MAE وR2 ارزیابی می گردد. طبق نتایج بدست آمده عملکرد مدل BAGTREE در روش های مختلف بهتر از سایر مدل ها بوده است.
واژگان کلیدی : سیستم های اطلاعات بیمارستان، پیش بینی، خرید دارو، داروخانه
فهرست مطالبعنوان صفحه TOC \o "1-2" \h \z \t "Heading 3,3,Heading 4,4,Heading 5,5,سطح 4,4" فصل 1- مقدمه PAGEREF _Toc408935725 \h 21-1- فناوری اطلاعات در بهداشت و درمان PAGEREF _Toc408935726 \h 21-2- داروخانه های بیمارستانی PAGEREF _Toc408935727 \h 31-3- داده کاوی PAGEREF _Toc408935728 \h 41-3-1- داده کاوی چیست؟ PAGEREF _Toc408935729 \h 41-3-2- تكنیك های مختلف داده كاوی PAGEREF _Toc408935730 \h 51-3-2-1-انواع تکنیک داده کاوی PAGEREF _Toc408935731 \h 61-4- بیان مسئله PAGEREF _Toc408935732 \h 81-5- اهداف تحقیق PAGEREF _Toc408935733 \h 101-6- سوالات وفرضیات تحقیق PAGEREF _Toc408935734 \h 111-6-1- سوالات PAGEREF _Toc408935735 \h 111-6-2- فرضیات تحقیق PAGEREF _Toc408935736 \h 121-7- فصول پایان نامه PAGEREF _Toc408935737 \h 12فصل 2- پیشینه پژوهشی PAGEREF _Toc408935738 \h 152-1- جمع بندی24فصل 3- مروری بر ادبیات تحقیق و مبانی نظری PAGEREF _Toc408935739 \h 353-1- سیستم های اطلاعات بیمارستان PAGEREF _Toc408935740 \h 353-2- تعريف و مفهوم سيستم اطلاعات بيمارستاني PAGEREF _Toc408935741 \h 383-2-1-- اهداف سیستم اطلاعات بیمارستانی PAGEREF _Toc408935742 \h 403-2-2- اهمیت و ضرورت راهاندازی سیستم اطلاعات بیمارستانی PAGEREF _Toc408935743 \h 413-2-3- مزایایی سیستم اطلاعات بیمارستانی PAGEREF _Toc408935744 \h 423-3- داده کاوی PAGEREF _Toc408935745 \h 443-4- مراحل داده کاوی PAGEREF _Toc408935746 \h 463-4-1- پیش پردازش داده ها PAGEREF _Toc408935747 \h 493-4-2- پاکسازی داده ها PAGEREF _Toc408935748 \h 493-4-3-یکپارچه سازی داده ها PAGEREF _Toc408935749 \h 503-4-4- تبدیل دادهها PAGEREF _Toc408935750 \h 503-4-5- تلخیص داده ها PAGEREF _Toc408935751 \h 513-5- وظایف داده کاوی PAGEREF _Toc408935752 \h 513-5-1- دسته بندی PAGEREF _Toc408935753 \h 523-5-2- تخمین PAGEREF _Toc408935754 \h 533-5-3- پیش بینی PAGEREF _Toc408935755 \h 543-5-4- گروه بندی شباهت یا قوانین وابستگی PAGEREF _Toc408935756 \h 543-5-5- خوشه بندی PAGEREF _Toc408935757 \h 553-5-6- نمایه سازی PAGEREF _Toc408935758 \h 563-6- كاربرد هاي داده كاوي PAGEREF _Toc408935759 \h 563-7- رویکردهاي مسائل داده کاوي در پزشکی PAGEREF _Toc408935760 \h 583-8- مدلها و الگوريتمهای داده کاوی PAGEREF _Toc408935761 \h 603-8-1- شبکه هاي عصبی مصنوعی PAGEREF _Toc408935762 \h 603-8-1-1-ساختار شبکه عصبی PAGEREF _Toc408935763 \h 613-8-1-2-معماري شبکه عصبی PAGEREF _Toc408935764 \h 623-8-1-3-آموزش شبکه هاي عصبی مصنوعی PAGEREF _Toc408935765 \h 643-8-1-4-انواع یادگیري در شبکه هاي عصبی مصنوعی PAGEREF _Toc408935766 \h 643-8-2- درخت هاي انتخاب PAGEREF _Toc408935767 \h 653-8-3- Bagging & Boosting PAGEREF _Toc408935768 \h 673-8-3-1-Bagging553-8-1-1-Boosting PAGEREF _Toc408935763 \h 613-8-1-1-الگوریتم های Boosting PAGEREF _Toc408935763 \h 613-8-4- Adaptive Boosting(Adaboost) PAGEREF _Toc408935769 \h 693-8-5- رگرسیون بردار پشتیبان PAGEREF _Toc408935770 \h 703-8-6- رگرسیون خطی PAGEREF _Toc408935771 \h 723-9 نرم افزارهای داده کاوی PAGEREF _Toc408935772 \h 753-10- فرایند خرید دارو PAGEREF _Toc408935773 \h 763-11- جمع بندی PAGEREF _Toc408935774 \h 78فصل 4- روش انجام پژوهش PAGEREF _Toc408935775 \h 804-1- مقدمه PAGEREF _Toc408935776 \h 804-2- الگوریتم پیشنهادی PAGEREF _Toc408935777 \h 814-3- پیش پردازش دادهها PAGEREF _Toc408935778 \h 824-3-1- ساخت ماتریس داده PAGEREF _Toc408935779 \h 834-3-1-1-روش ماههای متوالی674-3-1-2-روش ماههای یکسان PAGEREF _Toc408935763 \h 614-3-1-3-روش فصول متولی694-4- الگوریتمهای Prediction PAGEREF _Toc408935781 \h 864-4-1- روش NN PAGEREF _Toc408935782 \h 874-4-2-روش SVR PAGEREF _Toc408935783 \h 884-4-3- روش LSSVR PAGEREF _Toc408935784 \h 924-4-4- AdaBoost.R PAGEREF _Toc408935785 \h 944-5- مجموعه داده PAGEREF _Toc408935786 \h 964-5-1- پاکسازی داده PAGEREF _Toc408935787 \h 974-6- معیارهای ارزیابی PAGEREF _Toc408935788 \h 984-7- جمع بندی PAGEREF _Toc408935789 \h 100فصل 5- بحث و نتیجهگیری PAGEREF _Toc408935790 \h 1035-1- مقایسه روشهای مورد بررسی PAGEREF _Toc408935791 \h 1035-1-1- ارزیابی الگوریتم با روش ماههای متوالی PAGEREF _Toc408935792 \h 1045-1-2- ارزیابی الگوریتم با روش ماههای یکسان PAGEREF _Toc408935793 \h 1115-2- جمع بندی PAGEREF _Toc408935794 \h 123فصل 6- پیشنهادهاو فرصتهای پژوهشی آینده PAGEREF _Toc408935795 \h 127
فهرست جداول
عنوان صفحه
جدول 2- 1تکنیک های مهم داده کاوی در بخش دارویی[21] 21
جدول 4- 1 ماتریس داده بصورت ماههای متوالی60
جدول 4- 2 ماتریس داده بصورت ماههای یکسان61
جدول 4- 3 ماتریس داده بصورت فصول متوالی2
جدول 5- 1 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 77
جدول 5- 2 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Vialdioxin81
جدول 5- 3 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol82
جدول 5- 4 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 82
جدول 5- 5 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Vialdioxin 85
جدول 5- 6 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol86
جدول 5- 7نتایج اعمال الگوریتم های معرفی شده بر روی داده های Cream Calamine 91
جدول 5 - 8 نتایج اعمال الگوریتم های معرفی شده بر روی داده های Syrup Sulbutamol 93
فهرست شکل ها و نمودارها
عنوان صفحه
شکل 2- 1 مدل پیش بینی با شبکه عصبی[4]12
شکل 2- 2 شبکه عصبی [14] BP 12
شکل 2- 3 مدل بهینه سازی خرید دارو[15]14
شکل 2- 4 مدل استخراج دانش [26] 16
شکل 2- 5 جریان عملیات در داروخانه[17] 17
شکل 2- 6 دسته بندی اهدا بکارگیری داده کاوی[15]19
شکل 2- 7 روند بکارگیری داده کاوی در پزشکی[20]20
شکل3- 1 مراحل داده کاوی[40]32
شکل3- 2 ساختار شبکه عصبی[47]43
شکل3- 3 مثالی از درخت تصمیم[41]55
شکل 3- 4 واسط کاربری سیستم اطلاعات بیمارستان55
شکل 4- 1 دیاگرام چاچوب تحقیق58
شکل4- 2 پارامترهای مورد استفاده در SVM64
شکل4- 3 گزارش تهیه شده با کریستال ریپورت70
شکل4- 4 خروجی گزارش تهیه شده با کریستال ریپورت71
شکل5- 1 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R78
شکل5- 2 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR78
شکل5- 3 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE79
شکل5- 4 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR80
شکل5- 5 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR80
شکل5- 6 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE83
شکل5- 7 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR83
شکل5- 8 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR84
شکل 5- 9 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R84
شکل5- 10 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR85
شکل 5- 11 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R86
شکل5- 12 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LR87
شکل5- 13 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم SVR87
شکل5- 14 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR88
شکل5- 15 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم AdaBoost.R89
شکل5- 16 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم NN90
شکل5- 17 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR90
شکل5- 18 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR92
شکل5- 19 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE93
شکل5- 20 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم LSSVR94
شکل5- 21 میزان تقاضای واقعی و پیش بینی شده توسط الگوریتم BAGTREE94
فصل نخستمقدمه
مقدمه
فناوری اطلاعات در بهداشت و درمان
در سالهای اخیر مراکز بهداشتی ودرمانی کشورمان به ویژه بیمارستانها درصدد مکانیزه کردن سیستمهای اطلاعاتی خود برآمدهاند. در ابتدا مقصود از چنین فعالیتهایی کاهش هزینههای ناشی ازکاغذ بازی موجود در سیستمهای دستی و اداری بوده است، اما اکنون به مرحله ای رسیدهایم که بهبود کیفیت ارائه خدمات درمانی اهمیتی روزافزون مییابد و در این راستا بکارگیری سیستم های اطلاعات بیمارستانها بسیار مرسوم شده است.
بکارگیری سیستم اطلاعات بیمارستان علاوه بر مزایای فراوان از جمله کاهش زمان پذیرش، زمان ترخیص، زمان اخذ جوابها، زمان مراجعه به اطلاعات قبلی پرونده، بالا بردن میزان دقت در درج اطلاعات و درخواستها كه در حالت دستی می تواند ناخوانا باشد، همچنین می تواند موجب تسریع ارتباطات بین بخشی و در نهایت بالابردن میزان رضایت بیمار، ارائه خدمات بهتر، دریافت آمار و گزارشات روزانه و زمانی گردد. در نهایت بکارگیری سیستم های اطلاعات بیمارستان، حجم زیادی از داده های مرتبط با درمان را در دسترس قرار می دهد [1]. با استفاده از تکنیک های داده کاوی می توان از دادههای موجود در این سیستمها در جهت پشتیبانی از تصمیم و مدیریت و در نهایت پیشبرد اهداف اقتصادی و درمانی سود جست .[2] دادهکاوی یکی از ده دانش در حال توسعه است و در سالهای اخیر در دنیا گسترش فوقالعاده سریعی داشته است. دادهکاوی فرآیند کشف الگوها و روابط موجود بین داده ها در پایگاه داده های بزرگ است که با برخورداری از دامنه وسیع زیر زمینههای تخصصی با توصیف، تشریح، پیشبینی و کنترل پدیدههای گوناگون پیرامون، امروزه کاربرد بسیار وسیع در حوزههای مختلفی ازجمله پزشکی و تجارت دارد [3].
داروخانه های بیمارستانی
افزایش هزینههای بیمارستانی در سالهای اخیر و نیز اجرای طرح خودگردانی و ادارهی بیمارستانها به وسیلهی درآمد اختصاصی آنها، بیمارستانها را با مشکلات مالی جدی رو به رو ساخته است. داروخانه یکی از بخشهای مهم و درآمدزا در بیمارستان ها می باشد که می توان با بهبود خرید دارو و افزایش بهره وری آن، بنحوی به وضعیت اقتصادی بیمارستان ها کمک کرد. این حقیقت که مصرف دارو بر اساس شیوع بیمارها در فصول مختلف تغییر می کند و نیز در نظر گرفتن این نکته که برخی داروها برای درمان یک بیماری مکمل یکدیگرند، از جمله فاکتورهایی هستند که باید در خرید دارو درنظر گرفته شوند [4]. به عبارتی با توجه به بیماریهای بسیار متنوع، و تجویز داروهای مختلف برای آنها، میتوان بر اساس سابقه مصرف دارو، نیاز های دارویی در آینده را پیش بینی کرد در نتیجه، در صورت بکارگیری تکنیکهای داده کاوی بر روی اطلاعات موجود در سیستم اطلاعات بیماستان می توان خرید دارو را بر اساس پیش بینی صورت گرفته توسط داده کاوی بهینه کرد.
لذا بر آن شدیم تا با انجام این مطالعه به پیش بینی مصرف دارو، با استفاده از تکنیکهای داده کاوی، در داروخانه یک بیمارستان بزرگ به منظور افزایش بهره وری مالی آن بپردازیم.
داده کاوی
داده کاوی چیست؟
داده کاوی به بررسی و تجزیه و تحلیل مقادیر عظیمی از داده ها به منظور کشف الگوها و قوانین معنی دار اطلاق میشود.[5] کشف دانش و داده کاوی امروزه یک حوزه جدید میان رشته ای و در حال رشد است که حوزه های مختلفی همچون پایگاه داده، آمار، یادگیری ماشین و سایر زمینه های مرتبط را با هم تلفیق کرده تا اطلاعات و دانش ارزشمند نهفته در حجم بزرگی از دادهها را استخراج نماید و استفاده از آن در دو دهه اخیر تقریبا در جهان در همه سازمانها که با حجم عظیمی از داده در پایگاه داده خود مواجه هستند، رواج یافته است [6]. شناسایی مشکالت کاوش و یا برآورد وابستگیها از داده ها یا کلاً کاوش داده های جدید تنها قسمتی ازشیوههای تجربی مورد استفاده دانشمندان، مهندسین و دیگر کسانی است که روشهای استانداردی را برای کسب نتایج داده ها به کار می برند. درتطبیق روشهای تجربی معمول با مسائل داده کاوی میتوان به مراحل بیان مسأله و فرموله کردن فرضیه، جمع آوری دادهها، پیش پردازش دادهها شامل آشکارسازی و حذف دادههای غیر عادی و مقیاس بندی،رمزگذاری و انتخاب، برآورد و ارزیابی مدل و در نهایت تفسیر مدل ورسیدن به نتایج اشاره نمود [7].
تكنیك های مختلف داده كاوی
تكنیكهای مختلف داده كاوی را میتوان بر اساس نوع عملیاتی كه انجام میدهند به دو دسته « پیش بینی كننده » و « تشریح كننده » تقسیم كرد. تكنیكهای پیش بینی كننده با ساخت مدلی برای پایگاه داده، وظیفه پیش بینی موارد ناشناخته را بر عهده دارند. در حالی كه تكنیكهای تشریح كننده ، الگوهایی قابل فهم از داده ها را برای انسان كشف می كنند [8].در بین این الگوریتمها و مدلها، بهترین وجود ندارد و با توجه به دادهها و کارایی مورد نظر باید مدل انتخاب گردد.
1-3-2-1-انواع تکنیک داده کاوی [9]
قواعد انجمنی : قوانین انجمنی در دسته تکنیک های تشریح کننده قرار می گیرد و به پیدا كردن وابستگیها و همبستگیهای موجود در بین داده ها، یافتن الگوهایی كه غالبا در بین دادهها وجود دارند و همچنین پیدا كردن یك سری ساختار سببی در بین آیتمها و اشیای موجود در پایگاه دادههای تعاملی و رابطهای اشاره كرد.
پیش بینی : دراین روش هدف، پیش بینی یک متغیر پیوسته می باشد. مانند پیش بینی نرخ ارز یا هزینه های درمانی. اینجا ﻣﻘـﺎﺩﻳﺮ ﻣﻤﻜـﻦ ﺑـﺮﺍﻱ ﻣﺘﻐﻴﺮﻫﺎﻱ ﻧﺎﻣﻌﻠﻮﻡ ﭘﻴﺶ ﺑﻴﻨﻲ ﻣﻲ ﺷﻮﻧﺪ. ﺩﺭ پیش بینی ﺍﺑﺘﺪﺍ ﺩﺍﺩﻩ ﻫﺎﻳﻲ ﻛﻪ ﺑﻪ ﻣﺘﻐﻴﺮ ﻧـﺎﻣﻌﻠﻮﻡ ﻣﺮﺑـﻮﻁ ﻫﺴﺘﻨﺪ ﺑﻮﺳﻴﻠﻪ ﻱ ﺑﺮﺧﻲ ﺗﺤﻠﻴﻞ ﻫﺎﻱ ﺁﻣﺎﺭﻱ ﭘﻴﺪﺍ ﻣﻲ ﺷﻮﻧﺪ. ﺳـﭙﺲ ﺍﺯ ﺑﺮﺧـﻲ ﺭﻭﺵ ﻫـﺎﻱ ﻫﻮﺷـﻤﻨﺪ ﻣﺎﻧﻨﺪ ﺷﺒﻜﻪ ﻫﺎﻱ ﻋﺼﺒﻲ ﻭ ﺍﻟﮕﻮﺭﻳﺘﻢ ﮊﻧﺘﻴﻚ ﺑﺮﺍﻱ ﺍﻧﺠﺎﻡ ﭘﻴش بینی ﺍﺳﺘﻔﺎﺩﻩ ﻣﻲ ﺷﻮﺩ.
رده بندی یا طبقه بندی : فرآیندی برای پیدا کردن مدلی است که رده های موجود در دادهها را تعریف می نماید و متمایز می کند، با این هدف که بتوان از این مدل برای پیش بینی رده رکوردهایی که برچسب رده آنها (متغیر هدف) ناشناخته می باشد، استفاده نمود. در رده بندی بر خلاف پیش بینی، هدف پیش بینی مقدار یک متغیر گسسته است. روش های مورد استفاده در پیش بینی و رده بندی عموما یکسان هستند. و در دسته تکنیک های پیش بینی کننده قرار می گیرند.
خوشه بندی : گروه بندی مجموعه ای از اعضاء، رکوردها یا اشیاء به نحوی که اعضای موجود در یک خوشه بیشترین شباهت را به یکدیگر و کمترین شباهت را به اعضای خوشه های دیگر داشته باشند.
در این پایان نامه جهت پیش بینی مصرف دارو از تکنیک های پیش بینی استفاده می شود و با بررسی الگوریتمهای مختلف این تکنیک تلاش می شود مدلی مناسب جهت پیش بینی مصرف دارو در داروخانههای بیمارستانهای ایران معرفی گردد. همچنین از دادههای واقعی بیمارستان پاستور شهر تاریخی بم که در پایگاه داده SQL SERVER سیستم اطلاعات بیمارستان با حجمی در حدود GB220 و در مدت 5 سال ذخیره شدهاند جهت استفاده در مدلها و تکینیک های دادهکاوی استفاده خواهد شد.
بیان مسئله
در حال حاضر بیمارستان های دولتی کشور ما از کمبود منابع مالی ونقدینگی بشدت رنج می برند. یکی از بخش های تاثیر گذار بر وضعیت مالی بیمارستان ها داروخانه می باشد که در صورت افزایش سودآوری این بخش می توان به نحوی به وضعیت مالی بیمارستان ها کمک کرد
در ادامه به اختصار به گزیده هایی از اعتراف برخی از روسای بیمارستانهای بزرگ کشور توجه کنیم:
بیمارستانهای دولتی در صورت عدم رسیدگی تعطیل خواهند شد .[10]
در بیمارستانهای دولتی معضل اصلی این است که هزینه و درآمد با هم انطباق ندارد[11].
مشکلات بیمارستان به قدری زیاد است که معمولا پولی برای دارو باقی نمی ماند.[12]
مشکلات خرید و ویژگیهای دارو که با توجه به بررسی های انجام شده در داروخانه بیمارستانها میتوان به آنها شاره کرد.
خرید و نگهداری دارو حساسیتی بالایی دارد.
جهت خرید دارو از اطلاعات مصرف قبلی برای پیش بینی مصرف استفاده نمی شود و این باعث می شود در انتها فصل با اضافه موجودی مواجه شوند و مقداری از دارو ها به دلیل اتمام تاریخ مصرف غیر قابل استفاده شوند. و همچنین با توجه به عدم پیش بینی مناسب در بعضی از موارد با کمبود دارو مواجه شوند.که با توجه به وابستگی دارو ها در صورت نداشتن برخی از داروها، مراجعه کنندگان برای دریافت کل دارو ها بصورت کامل به داروخانههای خارج از بیمارستان مراجعه میکنند.
فروش دارو در داروخانهها بر خلاف سایر فروشگاهها بر اساس سلیقه مشتری نمی باشد و در نظر گرفتن اینکه نسخه پزشکان از اصول درمانی پیروی میکند.
بر طبق قانون جدید بیمارستان ها موظف اند تمام داروها و لوازم مصرفی که در بیمارستان استفاده می شود را موجود داشته باشند و بیماران نباید برای تهیه دارو و لوازم مصرفی به داروخانه های خارج از بیمارستان مراجعه کنند.
با توجه به ویژگیها و مشکلاتی که در بالا به آنها اشاره شد در صورت پیش بینی مصرف دارو می توان خرید را بهبود بخشید همچنین پیش بینی باعث میشود تا بیشترین پاسخگویی در برابر نیاز های درمانی بیماران را ارائه کرد.
راه اندازی سیستم های اطلاعات بیمارستان در بیمارستان های کشور،علاوه بر مزایای فراوان حجم زیادی از اطلاعات مربوط به بیمارستانها از جمله مصرف دارو را نگهداری می کنند[13 ] با بکارگیری داده کاوی بر روی داده های ذخیره شده در این سیستمها می توان مصرف دارو را پیش بینی کرد و با لحاظ کردن این پیش بینی در خرید دارو نهایتا خرید دارو را بهینه کرد.
اهداف تحقیق
با توجه به مشکلات مالی که گریبان گیر بیمارستان های کشور است. همچنین اهمیت و نقشی که داروخانهها درگردش مالی و درآمد بیمارستانهای کشور دارند. بر آن شدیم تا با انجام این مطالعه به پیش بینی مصرف دارو با استفاده از تکنیکهای داده کاوی، در داروخانه یک بیمارستان بزرگ به منظور افزایش بهره وری مالی آن بپردازیم. هدف از انجام این رساله این است که با استفاده از دادههای تاریخی و تکنیکهای دادهکاوی بتوان مدلی برای پیشبینی مصرف دارو ارائه داد. در واقع ارائه یک مدل مبتنی بر تکنیکهای دادهکاوی که تا کنون ارائه شده و میتوان از آنها برای پیش بینی مصرف دارو استفاده کرد. به همین دلیل باید روشهای مختلف پیش بینی را اعمال کرد تا بتوان مقایسه ای بین روشها و انتخاب بهترین روش داشته باشیم.
از دیگر اهداف تحقیق بکارگیری مدل ارائه شده بر روی داده های یک بیمارستان و ارزیابی نتایج حاصل از آن می باشد. مدل ارائه شده در این پایان نامه می تواند در سایر بیمارستان های کشور نیز مورد استفاده قرار بگیرد. ایده این تحقیق از پیشینه تحقیق و مطالعات انجام شده در این زمینه گرفته شده است. از جمله تحقیقی که توسط [14] Qinjkui انجام شد و در آن مدلی برای پیش بینی تقاضا برای استفاده از خدمات و تجهیزات در یک بیمارستان ارائه شد همچنین تحقیقی که توسط[19] Asadi بر روی سیستم اطلاعات داروخانه بیمارستانهای آموزشی و درمانی تابعه دانشگاه علوم پزشکی تهران انجام شد و نشان می دهد که اطلاعات موجود در این سیستم ها مورد تجزیه و تحلیل قرار نمی گیرند.
هدفی که این پژوهش را متمایز می کند این است که به پیش بینی مصرف دارو در بیمارستان های ایران می پردازد و مدلی برای پیش بینی مصرف ارائه می هد. همچنین یک جنبه جدید از مزایای سیستم اطلاعات بیمارستان ها را مشخص می کند.
سوالات وفرضیات تحقیق
سوالات
چه الگوریتمی جهت پیش بینی مصرف دارو مناسب است؟
چه عواملی بر خرید دارو موثر هستند؟
میزان دقت پیشبینی انجامشده تا چه حد است ؟
فرضیات تحقیق
با استفاده از دادههای تاریخی و تکنیکهای دادهکاوی میتوان مدلی برای پیشبینی مصرف دارو ارائه داد.
مدل ارائه شده توسط تکنیک های داده کاوی باعث بهبود خرید دارو خواهد شد.
شناخت بیشترین همبستگی و تأثیر عوامل مختلف بر خرید دارو با استفاده از تکنیکهای دادهکاوی میسر است.
امکان ارائه یک مدل مبتنی بر تکنیکهای دادهکاوی تا کنون ارائه شده و میتوان از آنها برای بهینه سازی خرید استفاده کرد.
فصول پایان نامه
در فصل اول پایان نامه مقدمهای درباره فناوری اطلاعات در بهداشت و درمان بیان شده و در ادامه به معرفی داده کاوی و بیان مسئله پرداخته، در پایان هم اهداف تحقیق و سوالات و فرضیات آمده است. فصل دوم به ارائه پیشینه تحقیق پرداخته است .فصل سوم، مروری است بر ادبیات تحقیق و مبانی نظری که در آن سیستم های اطلاعات بیمارستان، مزایای این سیستم ها، داده کاوی و الگوریتم ها و مدلهای مختلف تکنیک پیش بینی و همچنین فرایند خرید دارو شرح داده شده است. در فصل چهارم ابتدا چارچوب کلی پایان نامه و مراحل پیاده سازی را شرح داده، سپس توضیح مختصری راجع به مجموعه دادههای ایجاد شده داده میشود و در نهایت، به شرح الگوریتمهایی که براي ارزیابی مورد مقایسه قرار گرفته اند می پردازد.در فصل پنجم مدلهای مختلف جهت پیشبینی تقاضای دارو و ارزیابی این مدلها بررسی خواهد شد. مدلهای شبکه عصبی و انواع مدلهای رگرسیون بر روی مجموعه دادههای آمادهسازی شده اعمال و دقت پیشبینی هر مدل بررسی و با مدلهای دیگر مقایسه خواهد شد نهایتاً در فصل ششم پیشنهادات جهت انجام کارهای آاینده معرفی می شود.
فصل دوم
پیشینه پژوهشی
فهرست منابع
1.Reichertz P. Hospital information systems—Past, present, future. International Journal of Medical Informatics. . 2006;75(3-4):282-99.
2.yan-feng l. Data Mining of Inspection-time Rules in HIS with DeepSee. Database Technology and Applications (DBTA), 2010 2nd International Workshop on 27-28 Nov; Wuhan: IEEE; 2010. p. 1-4.
3.Berry MJA. Data Mining Tehniques: For Marketing, Sales, and Customer Support. New York: John Wiley & Sons; 2004.
4.Stephen. Pharmaceutical Marketing in Perspective - Its Value and Role as One of Many Factors Informing Prescribing2008 [cited 2008 07.01.08].
.5ج. شهرابی، داده کاوی، چاپ دوم. انتشارات جهاد دانشگاهی واحد صنعتی امیرکبیر، تهران. 1390
.6م. غضنفری ، داده کاوی وکشف دانش. چاپ اول، انتشارات دانشگاه علم وصنعت ایران، تهران. 1387
.7م. کانتاردزیک، داده کاوی.چاپ اول، انتشارات علوم رایانه، بابل. 1385
8.Bellazzi R. Predictive data mining in clinical medicine: Current issues and guidelines. International journal of medical informatics. 2008;77:81-97.
9.Weiss GM. Data Mining. Handbook of Technology Management, , . (Ed.) HB, editor. New York: John Wiley and Sons 2010.
10. " بیمارستانهای دولتی در صورت عدم رسیدگی تعطیل خواهند شد" [Online]. Available: http://www.isna.ir/fa/news/92081811448.
ADDIN EN.REFLIST 11." "چالشهای پیشروی اقتصا د درمان [Online]. Available: http://www.hamshahrionline.ir/print/235652.
12."بلاتکلیفی داروخانههای بیمارستانی و چندنکته" [Online]. Available: http://www.isna.ir/fa/news/92070100229.
13.Hong T. The application of information technology in the hospital pharmacy management based on HIS. Information Technology in Medicine and Education (ITME), 2012 International Symposium on; 3-5 Aug; Hokodate, Hokkaido: IEEE; 2012. p. 604-7.
14.Qingkui C. Study on the Demand Forecasting of Hospital Stocks Based on Data Mining and BP Neural Networks International Conference on Electronic Commerce and Business Intelligence2009. p. 284-9.
15.Desikan P. DATA MINING FOR HEALTHCARE MANAGEMENT. SIAM international conference on data minig2011.
16.HAMURO Y. Mining Pharmacy Data Helps to Make Profits. Data Mining and Knowledge Discovery 1998;2:391–8
17.Li J-s. "Data Mining in Hospital Information System". New Fundamental Technologies in Data Mining. 2011:143-71.
18.Bereznicki BJ. Data-mining of medication records to improve asthma management. MJA. 2008;189:21-5.
19.Asadi F. Pharmacy information systems in Tehran university hospitals and their relationship with pharmaceutical companies. Journal of Paramedical Sciences 2011;2:48-55.
20.Asfandiary N . Knowledge discovery in medicine: Current issue and future trend [press release]. ELSEVIER2014.
21.Ranjan J. APPLICATIONS OF DATA MINING TECHNIQUES IN PHARMACEUTICAL INDUSTRY. Journal of Theoretical and Applied Information Technology 2007:61-7.
22.Doddi S. Discovery of Association Rules in Medical Data. Medical informatics and the Internet in medicine 2001;26(1):25-33
.23 ا. حاجوی ، مدارک پزشکی، چاپ اول ، انتشارات نشرالکترونیک و اطلاع رسانی جهان رایانه، 1381.
.24ح. وکیلی منفرد، سيستم اطلاعات بيمارستانی و نقش آن در توسعه خدمات پزشکی وبهداشتی. مجله علمی-پژوهشی پژوهان. 1391;دوره11(شماره1).
25.Dorenfest S. The decade of the '90s. Poor use of IT investment contributes to the growing healthcare crisis. Healthc Inform. 2000;17(8):64-7.
26.Kim HS. A Clinical Document Architecture (CDA) to Generate Clinical Documents within a Hospital Information System for E-Healthcare Services. Computer and Information Technology, 2006 CIT '06 The Sixth IEEE International Conference on; Sept. 2006; Seoul: IEEE; 2006. p. 254.
27.Siyamian H. The role of health information management in hospital management. Scientific Communication. 2005;3(4):19-28.
28Hu D. Study on information system of health care services management in hospital. Services Systems and Services Management, 2005 Proceedings of ICSSSM '05 2005 International Conference on 13-15 June 2005: IEEE; 2005. p. 1498 - 501.
.29م. آقاجانی، بررسی و مقایسه سیستم های اطلاعات بیمارستانی. طب وتزکیه 1382; دوره 47
30.Khan NN. Hospital Information Systems: An Aid to Decision Making. Emerging Trends in Engineering and Technology (ICETET), 2010 3rd International Conference on; 19-21 Nov. 2010; Goa: IEEE; 2010. p. 657 - 63.
31.Xiaolan W. Improved Services in Hospital Information System. Information Technology and Applications (IFITA), 2010 International Forum on 16-18 July 2010; Kunming: IEEE; 2010. p. 358-61.
32.Ahmadi M. A Survey of Usability of Hospital Information Systems from the perspective of Nurses, Department Secretaries, and paraclinic Users in Selected hospitals: 2009 Journal of Health Administration. 2011;14(44):11-20.
33.Lenz R. Intranet meets hospital information systems – the solution to the integration.problem? Method Inform Med. 2001;40:99-105.
34.Collen M. A brief historical overview of hospital information system evolution in the United States. Int JBiomed Comput. 1991;29(3-4):169-89.
.35م. قاضی سعیدی، مديريت اطلاعات بهداشتي درمانی، ماهان – تهران 1384.
.36د.ترابی، مدیریت فناوری اطلاعات سلامت ،انتشارات جعفري 1389.
.37د.احمدی، مديريت اطلاعات بهداشتي: مديريت يك منبع استراتژيك،انتشارات واژه پرداز 1382.
38.Fayyad U. From data mining to knowledge discovery in databases. AI Mag. 1996;17(3):37-54.
39.Friedman J. Data Mining and Statistics: What’s the connection? Comput Sci Stat. 1998.
40.ع.مشکانی، مقدمه ای برداده کاوی، موسسه چاپ وانتشارات دانشگاه فردوسی مشهد،1388 .
41.Potomac. Two Crows Corporation, Introduction to Data Mining and Knowledge Discovery. Third ed: Two Crows Corporation; 1999.
42.Gupta S. Data Mining Classification Techniques Applied For Breast Cancer Diagnosis And Prognosis Indian Journal of Computer Science and Engineering (IJCSE). 2011:188-95.
43.Bushinak H. Recognizing The Electronic Medical Record Data FromUnstructured Medical Data Using Visual Text Mining TechniquesProf. Hussain Bushinak. InternationalJournal of Computer Science and Information Security. 2011;9(6):25-35.
44.Seifert JW. Data Mining : An Overview. Analyst in Information Science and Technology Policy, Resources S, and Industry Division; 2004.
45. Stühlinger W. Intelligent Data Mining for Medical Qualit 2000.
46.Ganesan N. .Application of Neural Networks in Diagnosing Cancer Disease Using Demographic Data. International Journal of Computer Applications 2010;1(26):0975-8887.
47.Haykin S. ; "Neural Networks: A Comprehensive Foundation second ed: Prentice-Hall Inc; 1999.
48.م. منهاج. مبانی شبکه های عصبی، دانشگاه صنعتی امیرکبیر، تهران 1392.
49.Machová K. A Bagging Method using Decision Trees in the Role of Base Classifiers Acta Polytechnica Hungarica. 2006;3(2).
50.Dietterich TG. An experimental comparison of three methods for constructing ensembles of decision trees:Bagging, boosting, and randomization Machine Learning. 2000;40(2):139-58.
51.Freund Y. Boosting a weak learning algorithm by majority. Information and Computation. 1995;121(2):256-85.
52.Skurichina M. The Role of Combining Rules in Bagging and Boosting 2004.
53.Demiriz A. Linear programming boosting via column generation. Machine Learning. 2002;46:225-54.
54.Hao X. An Improved Adaboost.R Algorithm and Its Application in Mining Safety Monitoring. Intelligent Information Technology Application, 2009 IITA 2009 Third International Symposium on; 21-22 Nov. 2009; Nanchang: IEEE; 2009. p. 287-90.
55.Solomatine DP. AdaBoost.RT: a Boosting Algorithm for Regression Problems. IEEE; 2004. p. 7803-8359.
56.Basak D. Support vector regression. Neural Inf Process. 2007;11:203-25.
57.Guohai L. Model optimization of SVM for a fermentation soft sensor with Applications2010.
58.Liu Y. Soft chemical analyzer development using adaptive least-squares support .vector regression with selective pruning and variable moving window size”, ., Vol. 48, pp.5731–574, 2009. Ind Eng Chem Res. 2009;48:5731-40.
59.Hong WC. Traffic flow forecasting by seasonal SVR with chaotic simulated annealing algorithm. Neurocomputing. 2011;74:2096-107.
60.Yin J. LogP prediction for blocked tripeptides with amino acids descriptors (HMLP) by multiple linear regressionand support vector regression. Procedia Environmental Sciences 2011;8:173-8.
61.Vapnik VN. The nature of statistical learning theory. second ed. New York: Springer; 1999.
62.Boser BE. A training algorithm for optimal margin classifiers. In: Haussler D, editor. 5th Annual ACM Workshop on COLT; Pittsburgh: ACM Press; 1992. p. 144-52.
63.L. Xu. Comparisons of Logistic Regression and Artificial Neural Network on Power DistributionSystems Fault Cause Identification. Mid-Summer Workshop on Soft Computing in Industrial Applications; June ٢٨-٣٠; Finland: IEEE; 2005.
64Kim YS. Comparison of the decision tree, artificial neural network, and linear regression methods based on the number and types of independent variables and sample size. Expert Systems with Applications: Elsevier; 2008. p. 1227-34.
65. “ Data Mining Software Suites”. [Online]. Available : http://www.kdnuggets.com /software/suites.html.
66.Lavrac N. Selected techniques for data mining in medicine, 16 (1999) 3–23. Artificial Intelligence in Medicine. 1999;3:16-23.
67. " بیمارستان پاستور بم " [Online]. Available: http://www.mubam.ac.ir
68. "شرکت تیراژه رایانه"[Online]. Available: http://www.trtco.com
69.Smola AJ. A tutorial on support vector regression: Springer 2004.
70.Bertoni A. A Boosting Algorithm for Regression. Available from: http://www.researchgate.net/...Boosting_Algorithm.../0deec524a8.
Abstract
Optimizing Buying Drugs Using Data mining
By
Mohammad Mahdi Toranji
Developing information technology’s application in health care systems leads to advantages including accessibility of data. Applying data mining methods on available data could improves management and decision making process. This study was aimed to evaluate various algorithms that have been used in data mining to define a model for prediction of medications utilization in hospitals. For this purpose we extracted data from health information system of Bam’s Pasteur hospital that was saved for 5 years. Models such as LSSVR, LR, BAGTREE, ADABOOST, SVR and MLP were evaluated in prediction of drug usage. Power of mentioned models for prediction was assessed according to MAE, RMSE, MSE and R2 measures. In conclusion BAGTREE model was revealed as best model.
Keywords : Hospital Information Systems, Buying Drugs, Prediction, Pharmacy
IN THE NAME OF GOD
Optimizing Buying Drugs Using Data mining
BY
Mohammad Mahdi Toranji
THESIS
SUBMITTED TO THE SCHOOL OF GRADUATE STUDIES IN PARTIAL
FULFILLMENT OF THE REQUIREMENTS FOR THE DEGREE OF MASTER
OF SCIENCE (MSc.)
IN
Information Technology Engineering (e-Commerce)
SHIRAZ UNIVERSITY
SHIRAZ
ISLAMIC REPUBLIC OF IRAN
EVALUATED AND APPROVED BY THE THESIS COMMITTEE AS:
………………………… , Ph.D., PROF. Of (CHAIRMAN)
.......…………………… , PhD., PROF . Of
………………………… , Ph.D., ASSOCIATEPROF Of
Information Technology Engineering
January 2015
Shiraz University
Faculty of eLearning
M.S. Thesis
In Information Technology Engineering (ECommerce)
Optimizing Buying Drugs Using Data mining
By
Mohammad Mahdi Toranji
Supervised by
Dr. Reza Boostani
January 2015