مبانی نظری و پیشینه تحقیق داده کاوی 9 (docx) 81 صفحه
دسته بندی : تحقیق
نوع فایل : Word (.docx) ( قابل ویرایش و آماده پرینت )
تعداد صفحات: 81 صفحه
قسمتی از متن Word (.docx) :
پیش بینی قیمت سهام با استفاده از داده کاوی و شبکه های عصبی
علیرضا جندقیان
استاد راهنما:
دکتر امیر عباس نجفی
پایان نامه کارشناسی ارشد
رشته مهندسی صنایع گرایش مهندسی مالی
شهریور 1393
پیش بینی قیمت سهام با استفاده از داده کاوی و شبکه های عصبی
علیرضا جندقیان
استاد راهنما:
دکتر امیرعباس نجفی
پایان نامه کارشناسی ارشد
رشته مهندسی صنایع گرایش مهندسی مالی
شهریور 1393
تقدیم به :
پدر و مادر عزیزم
که در تمام مراحل زندگی پشتیبانم بودند
\* mergeformatتاسيس 1307دانشگاه صنعتي خواجه نصيرالدين طوسيتأییدیه هیأت داورانشماره: تاريخ:هیأت داوران پس از مطالعه پایاننامه و شرکت در جلسه دفاع از پایان نامه تهیه شده تحت عنوان : پیش بینی قیمت سهام با استفاده از داده کاوی و شبکه های عصبی توسط آقای علیرضا جندقیان ، صحت و کفایت تحقیق انجام شده را برای اخذ درجه کارشناسی ارشد در رشته مهندسی صنایع گرایش مهندسی مالی در تاريخ ......../6/ 1393 مورد تأیید قرار میدهند.1- استاد راهنماجناب آقای دکتر امیرعباس نجفیامضاء2- استاد مشاورجناب آقای / سرکار خانم دکتر ..........................................امضاء3- ممتحن داخلیجناب آقای / سركار خانم دکتر ..........................................امضاء4- ممتحن خارجیجناب آقای / سركار خانم دکتر ..........................................امضاء5- معاونت آموزشی و تحصیلات تکمیلی دانشکدهجناب آقای دکتر عماد روغنیانامضاء
-4823976540529/10/1387-42160029/10/1387-4216
\* mergeformatتاسيس 1307دانشگاه صنعتي خواجه نصيرالدين طوسياظهارنامه دانشجوشماره: تاريخ:اینجانب علیرضا جندقیان دانشجوی کارشناسی ارشد رشته مهندسی صنایع گرایش مهندسی مالی دانشکده مهندسی صنایع دانشگاه صنعتي خواجه نصیرالدین طوسی گواهی مینمایم که تحقیقات ارائه شده در پایاننامه با عنوان پیش بینی قیمت سهام با استفاده از داده کاوی و شبکه های عصبی با راهنمايي استاد محترم جناب آقاي دكتر امیرعباس نجفی، توسط شخص اینجانب انجام شده و صحت واصالت مطالب نگارش شده در این پایاننامه مورد تأیید میباشد، و در مورد استفاده از کار دیگر محققان به مرجع مورد استفاده اشاره شده است. بعلاوه گواهی مینمایم که مطالب مندرج در پایان نامه تا کنون برای دریافت هیچ نوع مدرک یا امتیازی توسط اینجانب یا فرد دیگری در هیچ جا ارائه نشده است و در تدوین متن پایاننامه چارچوب (فرمت) مصوب دانشكده مهندسي صنايع را بطور کامل رعایت کردهام. چنانچه در هر زمان خلاف آنچه گواهي نمودهام مشاهده گردد خود را از آثار حقيقي و حقوقي ناشي از دريافت مدرك کارشناسی ارشد محروم ميدانم و هيچگونه ادعائي نخواهم داشت.امضاء دانشجو:تاریخ:
-5524506858029/10/1387-42170029/10/1387-4217
\* mergeformatتاسيس 1307دانشگاه صنعتي خواجه نصيرالدين طوسيحق طبع و نشر و مالکیت نتایجشماره: تاريخ:1- حق چاپ و تکثیر این پایاننامه متعلق به نویسنده آن میباشد. هرگونه کپی برداری بصورت کل پایاننامه یا بخشی از آن تنها با موافقت نویسنده یا کتابخانه دانشکده مهندسی صنایع دانشگاه صنعتی خواجه نصیرالدین طوسی مجاز میباشد.ضمناً متن این صفحه نیز باید در نسخه تکثیر شده وجود داشته باشد.2- کلیه حقوق معنوی این اثر متعلق به دانشگاه صنعتی خواجه نصیرالدین طوسی میباشد و بدون اجازه کتبی دانشگاه به شخص ثالث قابل واگذاری نیست.همچنین استفاده از اطلاعات و نتایج موجود در پایان نامه بدون ذکر مراجع مجاز نمیباشد.
-48514016383029/10/1387-42140029/10/1387-4214
تشکر و قدردانی :
به این وسیله از زحمات بی دریغ استاد گرامی، جناب دکتر نجفی کمال تشکر را به خاطر سعه صدر و راهنمایی هایشان دارم
چکیده
بازار سرمایه، به دلیل داشتن خواص بسیاری از جمله عدم نیاز به سرمایه زیاد و سوددهی بالا به بستر مناسبی برای سرمایه گذاری تبدیل شده است. به همین دلایل، رشد این بازارها با سرعت چشمگیری در حال افزایش است. همین امر باعث تقاضای بالاتر برای اطلاعات، تلاش بیشتر برای پیش بینی و ابداع مدل های جدید برای پیش بینی آینده بازار شده است. پیش بینی بازار سرمایه به دلیل وجود انبوهی از سرمایه گذاران با دیدگاه های متفاوت و اثرگذار بودن تعداد زیادی از متغیرها که عملا بررسی همه آنها ممکن نیست، کاری دشوار و چالش برانگیز می باشد. به همین دلایل، مدل های پیش بینی جدید معرفی شده و مدل های پیش بینی قبلی ارتقا می یابند و یا با یکدیگر ترکیب می شوند. به طور کلی می توان گفت که تلاش های صورت گرفته تا زمان فعلی، در سه دسته برای پیش بینی بازار سرمایه قرار می گیرند. دسته اول از تحلیل تکنیکی، دسته دوم از تحلیل بنیادین و دسته سوم از مدل های ریاضی استفاده می کنند. تلاش برای افزایش قابلیت های مدل های موجود با استفاده از تلفیق این مدل ها با یکدیگر، روند تازه ای است که نتایج رضایت بخشی را نیز به دنبال داشته است. بیشتر این تلاش ها در جهت پیش بینی قیمت ها برای یک دوره جلوتر با استفاده از تحلیل تکنیکی و تحلیل بنیادی در چارجوب مدل های ریاضی و هوش مصنوعی قرار می گیرند. در همین راستا در پژوهش پیش رو به تلفیق تحلیل تکنیکی، تحلیل به وسیله مدل های سری زمانی و داده کاوی پرداخته و برای اولین بار به پیش بینی دو قیمت برای دوره آینده می پردازیم. مدل های مذکور در قالب شبکه عصبی با یکدیگر تلفیق شده و نتایج نشان دهنده برتری عملکرد شبکه عصبی نسبت به مدل رگرسیون چند متغیره و مدل های سری زمانی دارند.
کلمات کلیدی : پیش بینی؛ شبکه عصبی؛ داده کاوی؛ سری زمانی؛ تحلیل تکنیکی؛ رگرسیون چند متغیره
فهرست مطالب TOC \o "1-3" \h \z \u فصل دوم PAGEREF _Toc522523715 \h 12ادبیات تحقیق PAGEREF _Toc522523716 \h 122-1- مقدمه PAGEREF _Toc522523717 \h 132-1-1- تحلیل تکنیکی PAGEREF _Toc522523718 \h 152-1-2- تحلیل بنیادین PAGEREF _Toc522523719 \h 152-1-3- تحلیل توسط مدلهای علمی PAGEREF _Toc522523720 \h 162-2- آیا بازار سرمایه پیش بینی پذیر است؟ PAGEREF _Toc522523721 \h 202-2-1- نظریه کارایی بازار سرمایه PAGEREF _Toc522523722 \h 202-2-2- فروض نظریه کارایی بازار PAGEREF _Toc522523723 \h 272-2-3- انتقادات وارد شده به نظریه کارایی بازار سرمایه PAGEREF _Toc522523724 \h 292-2-4- پاسخ نظریه کارا PAGEREF _Toc522523725 \h 302-2-5- نتیجه گیری PAGEREF _Toc522523726 \h 312-3- داده کاوی PAGEREF _Toc522523727 \h 332-3-1- مقدمه PAGEREF _Toc522523728 \h 332-3-2- مفهوم داده کاوي PAGEREF _Toc522523729 \h 352-3-4- اهداف داده کاوی PAGEREF _Toc522523730 \h 372-3-5- داده کاوي و رابطه آن با علم آمار PAGEREF _Toc522523731 \h 432-4- شبکه عصبی PAGEREF _Toc522523732 \h 452-4-1- معرفی: PAGEREF _Toc522523733 \h 452-4-2- کاربرد شبکه های عصبی PAGEREF _Toc522523734 \h 462-4-3- تعریف پایه شبکه های عصبی PAGEREF _Toc522523735 \h 462-4-4- ویژگی های شبکه عصبی PAGEREF _Toc522523736 \h 492-5- تحلیل تکنیکال PAGEREF _Toc522523737 \h 622-5-1- مقدمه: PAGEREF _Toc522523738 \h 622-5-2- اندیکاتورهای تحلیل تکنیکال PAGEREF _Toc522523739 \h 642-6- مرور پژوهش های مشابه PAGEREF _Toc522523740 \h 672-6-1- کاربرد شبکه عصبی در پیش بینی قیمت سهام PAGEREF _Toc522523741 \h 672-6-2- کاربرد شبکه عصبی در تعیین استراتژی مبادله سهام PAGEREF _Toc522523742 \h 752-6-3- کاربرد داده کاوی در بازار سهام PAGEREF _Toc522523743 \h 822-6-4- کاربرد شبکه عصبی و داده کاوی در پیش بینی قیمت سهام PAGEREF _Toc522523744 \h 84
فهرست شکل ها
TOC \h \z \t "ali2,1" شکل 1-1 : دسته بندی کلی تحلیل های کاربردی در بازار سرمایه PAGEREF _Toc398329316 \h 21
شكل2-2 : ساختار شبكه عصبي پيش رو (غير بازگشتي) باسه لايه ،لايه ورودي ، لايه مياني و لايه خروجي PAGEREF _Toc398329317 \h 45
شكل2-3 : ساختار شبكه عصبي برگشتي با سه لايه ، لايه هاي دوم و سوم برگشتي مي باشند. PAGEREF _Toc398329318 \h 45
شکل 2-4 : مدل یک نرون خطی و غیرخطی(خطی یا غیر خطی بودن به نوع تابع فعال ساز بستگی دارد) PAGEREF _Toc398329319 \h 47
شکل2-5 : نحوه عملکرد بایاس در خروجی ترکیب کننده خطی PAGEREF _Toc398329320 \h 48
شکل 2-6 : توابع فعالساز داده کاوی و نقش آن در پیش پردازش داده ها و داده کاوی سریهای زمانی و اندیکاتورهای تحلیل تکنیکال ی(الف) حدآستانه، (ب) خطی تکهای، (ج) سیگموئید تک قطبی، (د)گوسین، (ه) خطی (و) سیگموئید دوقطبی PAGEREF _Toc398329321 \h 50
شکل 2-7 : شبکه پیشرو با یک لایه فعال (خروجی) PAGEREF _Toc398329322 \h 51
شکل 2-8 : شبکه عصبی پیشرو با یک لایه مخفی و یک لایه خروجی PAGEREF _Toc398329323 \h 52
شکل 2-9 : شبکه عصبی بازگشتی بدون حلقه خودپسخور و نرونهای میانی PAGEREF _Toc398329324 \h 53
شکل 2-10 : شبکه بازگشتی با نرونهای مخفیبا حجم حافظه بالاتر PAGEREF _Toc398329325 \h 54
شکل 2-11 : یک شبکه عصبی با سه نرون و دولایه فعال PAGEREF _Toc398329326 \h 56
TOC \p " " \h \z \t "ali2,1"
فصل دوم
ادبیات تحقیق
2-1- مقدمه
بازارهای مالی به دلیل خصوصیات منحصر به فردی نظیر عدم نیاز به سرمایه کلان، سادگی و کم هزینه بودن معاملاتشان و عدم وجود ریسک نکول، در عصر اخیر به یکی از پرطرفدارترین حوزههای سرمایه گذاری تبدیل شدهاند. حکومتها و دولتها نیز به این دلیل که میتوانند با گرد هم آوردن سرمایههای اندک و سرمایه های کلان، بودجههای عظیمی برای امور کشوری فراهم کنند، همواره به گسترش این بازارها کمک کرده و با تصویب قوانین متعددی از جمله معافیتهای مالیاتی در تلاش برای کشاندن پس اندازهای مردم به این بازارها بوده اند. به دلیل همین خصوصیات، حجم عظیمی از سرمایه گذاران به این حوزه وارد شده و این بازارها با سرعت چشمگیری نیز در حال رشد هستند. این حجم زیاد سرمایه گذاران، برای کسب سود از این بازارها وارد آن شده و لذا همواره به دنبال راههایی برای افزایش دامنه سود خود بوده اند. این مسئله باعث شده است که سرمایه گذاران همواره به دنبال پیش بینی اتفاقات آینده و قیمت ها در بازار بوده و از این طریق کسب سود کنند؛ به همین دلیل است که همزمان با رشد این بازارها، مدل های بسیار متنوعی برای پیش بینی بوجود آمده و در حال گسترش نیز هستند. به طور کلی شاید بتوان سرمایه گذاران را به دو دسته تقسیم کرد، آنها که به مدل کارایی بازار سرمایه اعتقاد داشته و به پیش بینی این بازارها معتقد نیستند؛ و آنهایی که به روشهای مختلفی به پیش بینی در این بازارها می پردازند. در مورد نظریه کارایی بازار در ادامه به تفسیر سخن گفته خواهد شد و لذا در ادامه به مرور روشهای متنوعی که برای پیش بینی قیمت سهام بوجود آمده و به کار گرفته شده اند خواهیم پرداخت. به صورت کلی میتوان گفت که تلاش برای پیش بینی بازارهای مالی در سه حوزه اتفاق افتاده است، حوزه اول به بررسی ساختار بازار، سهام موجود در آن و صنایع پرداخته و با شناسایی ویژگی های خاص این بازارها به تشخیص و معرفی صنایع و یا سهام برتر پرداخته و سرمایه گذاران را از این طریق یاری میکنند. حوزه دوم به ایجاد یک مدل برای استراتژیهای سرمایه گذاری پرداخته و سعی دارند با شناسایی نقاط خرید و فروش سهام، کاری کنند که سرمایه گذاران در کمترین قیمت خرید و در بیشترین قیمت اقدام به فروش نمایند. حوزه سوم اما به پیش بینی قیمت سهام میپردازند، جایی که بیشترین گستردگی استفاده از الگوریتمها و مدلهای مختلف در آن وجود دارد. این حوزه را میتوان به صورت کلی در سه بخش یا سه دیدگاه دید؛ تحلیل تکنیکال، تحلیل بنیادین و تحلیل با مدلهای هوش مصنوعی. در ادامه به توضیح مختصری در مورد هر یک از این دیدگاه ها خواهیم پرداخت.
2-1-1- تحلیل تکنیکی
روشی برای پیشبینی قیمتها در بازار از طریق مطالعه وضعیت گذشته بازار است. در این تحلیل از طریق بررسی تغییرات و نوسانهای قیمتها و حجم معاملات و عرضه و تقاضا میتوان وضعیت قیمتها در آینده را پیشبینی کرد. این روش تحلیل در بازار ارزهای خارجی، بازارهای بورس اوراق بهادار و بازار طلا و دیگر فلزات گرانبها کاربرد گستردهای دارد.
این نوع تحلیل با استفاده از مطالعه رفتار و حرکات قیمت و حجم سهام در گذشته و تعیین قیمت و روند آینده سهم صورت میپذیرد. تغییرات قیمت سهم با استفاده از پیشینه تاریخی و نمودار توسط تحلیل گر تکنیکی مورد تجزیه و تحلیل قرار میگیرد. این روش بیشتر مورد استفاده سفتهبازان قرار میگیرد و بدین صورت قصد دارند تا بازده مورد نظر خود را در هنگام بالا رفتن قیمت سهم افزایش دهند. در واقع سرمایه گذاران با دیدگاه کوتاه مدت از این روش بهره میجویند.
تحلیل تکنیکی (فنی)، با آزمون قیمتهای گذشته و حجم مبادلات حرکتهای آینده، قیمت را پیش بینی میکند. اساس این تحلیلها بر استفاده از نمودار و رابطههای ریاضی و هندسی متمرکز است تا بدین گونه روندهای کوچک و بزرگ بدست آید. در این راستا فرصتهای خرید یا فروش از راه برآورد محدوده نوسانات بازار مشخص میشود.
2-1-2- تحلیل بنیادین
تحلیل بنیادین یک شرکت شامل تحلیل گزارشات مالی و سلامت مالی شرکت، مدیریت و امتیازات رقابتی، رقبا و بازارهای مربوطه است. هنگامیکه این تحلیل در بازارهای آتی و فارکس به کار میرود، تمرکز اصلی بر شرایط اقتصادی، نرخ بهره، تولید، سودآوری و مدیریت است. وقتی سهام، قراردادهای آتی یا ارز مورد تحلیل بنیادین قرار میگیرد، دو رویکرد اساسی وجود دارد: تحلیل پایین به بالا و تحلیل بالا به پایین. این عبارات جهت تمیز دادن چنین تحلیلهایی از سایر تحلیلهای سرمایه گذاری نظیر تحلیلهای کمی و تکنیکی است. تحلیل بنیادین بر اساس دادههای گذشته و فعلی با هدف پیش بینی مالی انجام میپذیرد. اهداف متعددی برای این تحلیل وجود دارد. تعیین ارزش سهام شرکت و پیش بینی تغییرات آتی قیمت، برآورد عملکرد تجاری و ارزیابی مدیریت و اتخاذ تصمیمات داخلی جهت محاسبه ریسک اعتباری در تحلیل بنیادین اساس پیش بینی بر مبنای وقایع و رخدادهای واقعی پایه گذاری شدهاست. معامله گر با تحلیل اتفاقات و اخبار دنیای واقعی و بر اساس دانش و استراتژی خود، به پیش بینی بازار میپردازد. استراتژی روش محاسبه نقاط ورود به بازار و خروج از آن است. پایه نظر تحلیل گران بنیادی این است که تمام تغییرات در قیمتها حتماً یک علت اقتصادی بنیادی دارد.
2-1-3- تحلیل توسط مدلهای علمی
مدلهای علمی بسیار متنوعی برای استفاده در پیش بینی، در چند دهه اخیر معرفی و به کارگیری شدهاند. از مدلهای کلاسیک پیش بینی رگرسیونی گرفته تا متدهای متنوع و به روزی که در سریهای زمانی معرفی می شوند؛ از جمله کارهای ارزشمند استفاده شده در این عصر هستند. در سال های اخیر اما، استفاده از الگوریتم های کلاسیک معرفی شده کمتر شده و خبرگان مالی به استفاده از روشهای نوین معرفی شده توسط علم هوش مصنوعی روی آوردهاند. دلیل این امر این است که پیچیدگی بسیار زیاد بازار سهام، استفاده از مدلهای خطی را محدود کرده است. در واقع رفتار غیر خطی کاملا در قیمت سهام مشخص بوده و تخمین آن با متدهای خطی باعث ایجاد خطای زیادی میگردد. در این میان، استفاده از الگوریتمهای کلاسیک غیرخطی نیز کارایی چندانی ندارند. دلیل این امر نیز این است که در این متدها باید مدلی که قرار است به دادهها برازش شود باید از قبل معلوم باشد و همچنین این مدلها دارای محدودیت زیادی در شکل و پیچیدگی هستند و لذا استفاده از این مدلها، به مراتب حتی از مدلهای خطی نیز کارایی کمتری دارند. در این میان، حجم بالای دادههای موجود و محدودیتهای مدلهای کلاسیک نیز از جمله مشکلات دیگری است که این حوزه را به سمت استفاده از مدلهای هوش مصنوعی سوق داده است.
علم هوش مصنوعی با معرفی ابزارهای بسیار متنوعی مثل شبکههای عصبی ، ماشین بردار پشتیبان و الگوریتمهای فراابتکاری امکانات بی نظیری را برای کار با داده های فراوان، تخمین مدلهای بسیار پیچیده و سرعت عمل بالا در برازش فراهم آورده و به همین دلایل با اقبال بسیار زیادی روبرو شده است. در این میان، قابلیت استفاده از شبکههای عصبی برای پیش بینی قیمت بسیار بالاتر از ابزارهای دیگر است. دلیل این امر این است که این شبکهها قابلیت تخمین مدلهای پیچیده تر و کار با تعداد داده های بسیار زیادتر را دارد. در تحقیقات انجام شده عصر حاضر نیز بیشترین استفاده از مدلهای هوش مصنوعی در حوزه پیش بینی سهام، به استفاده از این شبکه ها باز میگردد.
نکته مهمی که در مورد این شبکهها وجود دارد این است که این شبکهها اغلب دارای بیش برازش میگردند. به این معنا که مدل را حتی از حد واقعی خود نیز پیچیده تر تخمین میزنند. برای جلوگیری از این اتفاق، باید معماریهای مناسبی را برای شبکه انتخاب کرده و الگوریتم های یادگیری را نیز به درستی استفاده کرد. علاوه بر این لازم است که میزان اطلاعات ورودی به این شبکه نیز محدود شده و پیچیدگیهای احتمالی را از بین ببرد. در مورد شبکه های عصبی و معماری ها و الگوریتمهای یادگیری آنها در ادامه به تفصیل پرداخته خواهد شد، اما در مورد کاهش حجم ورودی ها و به گزین کردن آنها، از علم داده کاوی استفاده می شود. این علم میان رشته ای با ابزارهای بسیار متنوعی که تعریف میکند، قابلیت های بی نظیری را برای پیش پردازش داده ها و توصیف مجموعه داده ها معرفی میکند. این علم نیز در ادامه به تفصیل توضیح داده خواهد شد. شکل (1) مروری کلی بر بخش مقدمه و تحلیل های ممکن در بازار سرمایه را نشان می دهد :
شکل 1-1 : دسته بندی کلی تحلیل های کاربردی در بازار سرمایه
همانگونه که ذکر شده؛ بررسیهای انجام شده در بازار سرمایه در سه حوزه کلی شناسایی سهام مناسب برای سرمایه گذاری، شناسایی و به کارگیری استراتژی مناسب برای خرید و فروش در بازار و پیش بینی قیمتهای آینده سهام قرار میگیرند. همچنین، به صورت کلی تحلیلهای ممکن در مورد قیمت سهم در آینده در سه بخش تحلیل تکنیکی، تحلیل بنیادین و تحلیل توسط متدهای ریاضی قرار میگیرند. متدهای ریاضی نیز در دو دسته متدهای کلاسیک و متدهای هوش مصنوعی قرار گرفته و بررسی می شوند. در ادامه این تحقیق، در ابتدا به بررسی امکان پیش بینی و نظریه کارایی بازار سرمایه پرداخته و سپس به توضیح شبکه عصبی و داده کاوی پرداخته خواهد شد.
2-2- آیا بازار سرمایه پیش بینی پذیر است؟
2-2-1- نظریه کارایی بازار سرمایه
بیش از ربع قرن است که توجه استادان مالی و اقتصادی دانشگاهها متوجه کارایی بازار سرمایه (Capital Market Efficiency) در کشورهای مختلف شده است. برای کشورهای سرمایهداری، کارا بودن بازار از اهمیت زیادی برخوردار است، چرا که در صورت کارا بودن بازار سرمایه، هم قیمت اوراق بهادار به درستی و عادلانه تعیین میشود و هم تخصیص سرمایه که مهمترین عامل تولید و توسعه اقتصادی است، به صورت مطلوب و بهینه انجام میشود. در دنیای مالی سه سطح کارایی بازار وجود دارد:
کارایی اطلاعاتی
کارایی تخصیصی
کارایی عملیاتی
2-2-1-1- کارآیی اطلاعاتی
وجود اطلاعات کافی در بازار و انعکاس به موقع و سریع اطلاعات، بر روی قیمت اوراق بهادار، ارتباط تنگاتنگی با کارایی بازار دارد. در بازار کارا، اطلاعاتی که در بازار پخش میشود به سرعت بر قیمت تأثیر میگذارد. در چنین بازاری قیمت اوراق بهادار به ارزش ذاتی آن نزدیک است، به عبارت دیگر، ویژگی مهم بازار کارا این است که قیمت تعیین شده در بازار، شاخص مناسبی از ارزش واقعی اوراق بهادار است. بنابراین بازار کارا به بازاری اطلاق میشود که در آن قیمت اوراق بهادار از قبیل قیمت سهام عادی منعکسکنندة تمام اطلاعات موجود در بازار یاد شد.
بازار کارا باید نسبت به اطلاعات جدید حساس باشد. اگر اطلاعات تازهای به اطلاع عموم برسد قیمت سهام عادی شرکت متناسب با جهت اطلاعات یاد شده تغییر خواهد کرد. اگر بازاری نسبت به اطلاعات جدید بیتفاوت باشد و عکسالعمل لازم را نشان ندهد؛ یعنی تحلیلکنندهای در بازار برای ارزیابی و بررسی اثر اطلاعات جدید بر قیمت نباشد، طبعاً آن بازار کارآیی نخواهد داشت.
کارآیی اطلاعاتی به نوبة خود به سه شکل ضعیف، نیمهقوی و قوی تقسیم میشود:
شکل ضعیف: انعکاس اطلاعات در قیمت سهام ممکن است در سطحی نازل و به اصطلاح در شکل ضعیف آن مطرح باشد. در این سطح از کارایی، قیمتهای اوراق بهادار فقط اطلاعاتی را که در گذشته قیمتها نهفته است و از توالی تاریخی قیمتها حاصل میشود، منعکس میکنند، و این اطلاعات بلافاصله در قیمتهای جاری منعکس میشوند. در این حالت فرض میشود قیمت اوراق بهادار فقط منعکسکننده روند تاریخی قیمت سهام است و قادر نیستیم روند آینده قیمت سهام را پیشبینی کنیم؛ قیمت سهام روند خاصی ندارد. بازار سهام حافظهای ندارد؛ یعنی قیمت سهام در بازار کارا به شکل تصادفی تغییر میکند. این همان نظریه گشت تصادفی است. اگر این نظریه صحت داشته باشد، آن دسته از سرمایهگذاران که براساس نمودار سهام را انتخاب میکنند، راه خطا میروند. (اصولا دو گروه تحلیلگر در بازارهای سرمایه داریم: چارتیستها بنیادگراها)
چارتیستها معتقدند که امکان محاسبه ارزش ذاتی سهام و اوراق قرضه وجود ندارد. باید انتخاب سهام و اوراق قرضه وجود ندارد. باید انتخاب سهام را براساس نمودار انجام دهیم. میگویند بازار دستخوش حالتهای شبهروانی میشود. همچنین میگویند با بررسی روند گذشته قیمتها میتوان روند آینده را پیشبینی کرد. آدمی خبره میتواند این روند را تشخیص دهد. استادان مالی دانشگاهها به این گروه ایراد میگیرند و میگویند آنها فالگیران حرفه مایند، گروه اخیر هوادار بررسیهای بنیادیاند. معتقدند هر سهم ارزش ذاتی دارد، و برای تعیین آن ارزش، میباید با اتکا به همه مطالعات موجود به مطالعه عمیق و بنیادی شرکت و کل اقتصاد پرداخت. چارتیستها در برخورد با نظریات و استدلالهای بنیادگراها موضعی دفاعیتر گرفته میگویند: هدف ما تعیین تغییرات بلندمدت ارزش سهام نیست؛ باید به دنبال استفاده از فرصتهای کوتاهمدت بود؛ سودهای آتی را باید دنبال کرد. مطالعات دانشگاهیان نشان داده است که با احتساب هزینههای کمیسیون خرید و فروش، سود کسی که از نمودار استفاده میکند، بیش از کسی نیست که برحسب تصادف سهام را میخرد. البته، هر دو گروه معتقدند که بازار تغییر قیمت دارد و مقداری از این تغییر لحظهای است و حاصل عدم تعادل بین عرضه و تقاضا در لحظه خاص است و به ارزش بلندمدت سهام ربطی ندارد. بقیه تغییرات میانمدت و بلندمدت است. چارتیستها میگویند ما میتوانیم منحنی بالا و پایین رفتن قیمت سهام را ترسیم کنیم، و یک راه پولدار شدن این است که معین کنیم در چه زمان باید سهام را خرید و در چه زمانی آن را فروخت. بنیادگراها میگویند مشکل این استکه نمیدانیم چه وقت قیمت، پایینتر است که بخریم و چه وقت بالاترین است که بفروشیم. اینان میگویند میزان بازده بهدست آمده به پذیرش خطر مربوط میشود. اینان نمیگویند میلیونر شدن در بازار بورس ممکن نیست؛ اما عقیده دارند میلیونر شدن از روی نمودار امکان ندارد، چنین کاری در بازار کارامد فقط به اقبال افراد بستگی دارد. در بازار کارامد نمیتوان پیوسته بازدهی بهتر از بازار بهدست آورد. در کوتاهمدت میشود، اما آن هم صرفاً به اقبال بستگی دارد و نه به خبرگی و چارت.
پس، در شکل ضعیف نظریه کارایی بازار، فرض بر این است که قیمتهای سهام بازتاب آن اطلاعاتی است که در تاریخچه گذشته قیمتهای سهام نهفته است؛ مثلاً، اگر الگویی فصلی در قیمتهای سهام یافت شود، مثلاً کاهش قیمتها در آخرین روز معامله سال و آنگاه افزایش آن در اولین روز معامله سال جدید، بازار، این الگو را بهسرعت شناسایی، و با تعدیل قیمت، اثر این پدیده را خنثی میکند. با پیشبینی افزایش قیمت در روز اول سال جدید، کارگزاران خواهند کوشید که در همان لحظههای اولیه افتتاح بورس در سال نو، از این تفاوت استفاده کنند. تلاش آنها برای خرید، باعث افزایش قیمت در همان دقایق نخستین میشود. کارگزاران پختهتر و باهوشتر فرامیگیرند که کار درستتر، خرید سهام در آخرین روز پایانی سال قبل است، چراکه در این ساعت قیمتها پایینتر است. تلاش آنان برای خرید در روز آخر باعث افزایش قیمتها میشود، و دامنه کاهش قیمت در روز آخر را کاهش میدهد. این روند خرید زودتر و زودتر آنقدر ادامه مییابد تا اثری از بالا رفتنهای عمده و پایینآمدنهای بزرگ در نمودار قیمتها باقی نماند. هر نوع الگوی مشابه و حتی پیچیدهتری در طول زمان حذف میشود، تا آنجا که امکان هر نوع پیشبینی روند آینده از الگوی گذشته ناممکن شود. وقتی به این مرحله از کار برسیم، شکل ضعیف نظریه بازار کار تحقق یافته است.
شکل نیمهقوی: این سطح از نظریه میگوید که قیمت سهام، منعکس کننده همه اطلاعات عام و منتشر شده است. در اینجا، اطلاعات عام محدود به قیمتهای گذشته نیست و دربرگیرنده هر اطلاعاتی درباره عملکرد شرکت و مشخصات صنعتی است که آن شرکت در آن فعالیت میکند.
بورسهای معروف دنیا معمولاً از شرکتها میخواهند که اطلاعاتی درباره تمامی اوضاع شرکت را به اطلاع عموم برسانند. در بازار کارا در شکل نیمهقوی، قیمت بلافاصله با ورود اطلاعات جدید متأثر میشود؛ مثلاً در بورس نیویورک، اگر قیمت سهم جنرال موتورز x دلار است، این رقم با توجه به همه اطلاعاتی است که درباره این شرکت منتشر شده است، و اگر اطلاعات تازهای درباره این شرکت و یا صنعت و کل اقتصاد برسد، در یک بازار کارا، بلافاصله تعدیل قیمت صورت میگیرد. این کارایی کمک بزرگی به سرمایهگذاران است، بهویژه آنهایی که کاری با بورس ندارند، و نیز برای کسانی که شناختی همهجانبه از امور مالی ندارند. اگر تعدیل قیمت بلافاصله پساز رسیدن اخبار و وقوع حوادث رخ ندهد (که مثلاً در بورس تهران رخ نمیدهد) این نشانه عدم کارایی بازار وعدم استقرار نیروهای بازار در آن موقعیت است.
شکل قوی: در این حالت فرض آن است که تمام اطلاعات مربوط و موجود، اعم از اطلاعات محرمانه و اطلاعات در دسترس عموم (جاری) در قیمت اوراق بهادار انعکاس مییابد. قیمت اوراق بهادار حتی منعکس کننده تمام اطلاعات محرمانه جاری و تاریخی است. این دیگر گستردهترین مفهوم از کارایی است؛ در این شکل، اگر اتفاقی در شرکت بیفتد دیگر نمیشود گفت که فقط مدیرعامل آن را میداند و دیگران از آن بیاطلاعند. در این زمینه، قیمت سهام شرکت مورد نظر بلافاصله در برابر این اتفاق واکنش نشان میدهد، چرا که دیگر اطلاعات محرمانهای (معامله به اتکای اطلاعات محرمانه در بسیاری از کشورها جرم، و حتی جرم جنایی به شمار میرود و در صورت اثبات، مشمول جرائم سنگین و پرداخت خسارت میشود) نباید در میان باشد.
در چنین شرایطی، فرض این است که سیستمهای کنترل داخلی شرکت به قدری قوی است که کسی نمیتواند اطلاعات محرمانه یا اطلاعات اختصاصی، داشته باشد. وقتی مثلاً مدیرعامل یا هیأتمدیره از امری باخبر میشوند، بلافاصله بقیه نیز آن را میشنوند و چون همه خبر دارند، قیمت به سرعت تأثیر میپذیرد و بنابراین، اطلاعات به ظاهر محرمانه دیگر ارزش چندانی برای آن مدیرعامل و سایر مدیران عالیرتبه ندارد. (معمولاً معامله سهام توط مدیران ممنوع نیست، ولی آن معاملهها میباید به اطلاع ضابطان و مسئولان رسانده شود. به علاوه، مدیرانی که سهم شرکت خود را میخرند یا میفروشند، نباید به سرعت این کار را انجام دهند. معمولاً برای این کار فاصله زمانی تعیین میشود؛ مثلاً ٦ ماه، یعنی حداقل بین خرید و فروش ٦ ماه فاصله زمانی لازم است و چنین فاصلههایی مجاز است و میباید به اطلاع عموم هم برسد) شکی نیست که این نوع کارآیی فقط در کتابها یافت میشود، و حتی در بورسهای بسیار معتبر هم واقعیت نمییابد؛ یعنی آنهایی که دسترسی دست اول به اطلاعات دارند، بازدهی سرمایهگذاریشان بیش از عامه مردم و سرمایهگذاران معمولی است. اگر بازار به شکل قوی کارا نباشد، کسی که سرمایه دارد و اطلاعاتش از بقیه بیشتر است و افراد خبرهای رای تحلیل این اطلاعات خاص در دسترس دارد، قاعدتاً بازده بیشتری بهدست میآورد. البته، کسانی هم هستند که غیر از اشاره به شواهد تجربی، معتقدند که شکل قوی بازار کارامد سرمایه عملی نیست، چون تمایز بین اطلاعات محرمانه و غیرمحرمانه میسر نیست، و بهعلاوه از شدت محرمانه بوددن اطلاعات در طول زمان کاسته میشود. چهبسا موضوعی که امروز محرمانه است، فردا غیرمحرمانه تلقی شود. به علاوه، هنوز آزمون دقیقی که آشکارا بیانگر تأثیر اطلاعات محرمانه بر قیمت اوراق بهادار باشد، به اجرا درنیامده است؛ یعنی بهطور عملی روشن نشده که چنین تأثیری وجود دارد.
هرچه از سطح ضعیف نظریه به سمت سطح قوی نزدیک میشوید، انواع مختلف تحلیلهای سرمایهگذاری در تعیین مرز بین سرمایهگذاریهای سودآور و غیرسودآور اثر خود را از دست میدهند و کمرنگتر میشوند.
اگر شکل ضعیف معتبر باشد، تحلیل فنی یا تحلیل نمودار قیمت سهام بیاثر میشود. وقتی حرکت قیمت سهام از الگوی خاصی تبعیت میکند، استفادهکننده از نمودار (چارتیست) نتیجه میگیرد که سهام در آینده جهت معینی خواهد داشت. درواقع، چارتیست از فنون مختلف برای ارزیابی رشته قیمتهای قدیم سهام سود میجوید تا رشته قیمتهای آینده سهام را برآورد کند. اگر شکل ضعیف بازار کارا برقرار باشد، اطلاعاتی در قیمتهای گذشته سهام وجود ندارد که در پیشبینی آینده بهکار آید. هر اطلاعی که بوده توسط هزاران چارتیست قابل در مناطق مختلف تحلیل شده، و به اتکای آن تحلیلها خرید و فروش صورت گرفته است. از اینرو، قیمت سهام به سطحی میرسد که دربرگیرنده همه اطلاعات مفید منعکس در قیمتهای گذشته سهام است.
اگر شکل نیمهقوی فرضیه بازار کارا مورد نظر باشد، هیچ تحلیلی به شما کمک نمیکند که بازدهی بهتر از بقیه به دست آورید. تا زمانی که تحلیل شما به اطلاعات عام منتشر شده متکی است، مثلاً تحلیل صورتهای حسابداری شرکت، دیگر تحلیل کارساز نیست و نمیتواند به تمایز بین سرمایهگذاری سودآور و غیرسودآور منجر شود. این صورتها را قبلاً هزاران تحلیلگر دیگر مورد بررسی قرار دادهاند؛ آن تحلیلگران به اتکای آنچه یافتهاند، عمل کردهاند، و قیمت جاری سهام اکنون بازتاب تمام اطلاعات مربوطی است که در صورتهای مالی یافت میشود. همین مسئله در مورد سایر منابع اطلاعات عمومی منتشر شده صدق میکند.
2-2-2- فروض نظریه کارایی بازار
شرایط بازار رقابت : آنچه در کتابهای اقتصاد درمورد شرایط برقراری رقابت در بازار مطرح است، مطالبی است که در این مورد قابل ذکر است. نکتههایی از قبیل تعداد فراوان و کافی عرضهکننده و تقاضاکننده در بازار، و یا آزاد بودن ورود و خروج به بازار برای همه مردم، و نبودن مانع و شرط و شروطی برای این کار، شرط مهم حضور تعداد بسیاری شرکتکننده در بازار است؛ یعنی بازار وقتی کارا میشود که تعداد افرادی که اقدام به خرید و فروش میکنند بسیار زیاد باشد. در بازاری که معامله کم انجام میشود و افراد مشارکتکننده در آن کم باشند کارآیی وجود ندارد.
اطلاعات رایگان : اطلاعات باید به سرعت و فوریت و با حداقل هزینه به اطلاع دستاندرکاران بازار برسد.
امنیت معاملات : کسی که در این بازار خرید و فروش میکند باید احساس امنیت کند و اطمینان بیابد که آنچه بابت اوراق بهادارش دریافت یا پرداخت میکند، به ارزش ذاتی آن نزدیک است؛ یعنی قیمت عادلانهای برای کالای خود دریافت میکند.
هزینه پایین معاملات : معامله در بازار کارا نباید گران باشد، مخارج معامله کردن بسیار کم، و به وضعیت بدون خرج بودن نزدیک باشد.
گستردگی بازار : هیچ معاملهگری آن چنان که قدرت نداشته باشد که بازار را زیر نفوذ خود بگیرد و تأثیر مهمی بر بازار بگذارد.
عدم محدودیت فرض دهی / گیری : در این بازار، هر کس میتواند به نرخهای رایج بازار مالی قرض بدهد و قرض بگیرد. این مورد به معنی عدم وجود هزینههای معامله کردن و مالیات در بازار هم هست.
وجود آربیتراژگران : در بازار کارا، تعدیل قیمتها به سرعت انجام میشود. در این بازار افراد زیادی حضور دارند که اطلاعات را دریافت و ارزیابی نموده و ارزش آن را پیدا میکنند و به فوریت اقدام به خرید و فروش میکنند. اقدام فوری آنان باعث میشود که اطلاعات موجود دقیقاً و به سرعت روی قیمتها انعکاس یابد. چون ورود اطلاعات به بازار و تأثیر آن بر قیمتها به شکل تصادفی است و وابستگی و تمایل و تورش خاصی ندارد، پس تغییرات قیمت در این بازار روند خاصی ندارد و روند تغییر قیمت و الگوی رفتاری آن تصادفی و غیرمنظم است و به اصطلاح قیمت تابع گشت تصادفی است.
رقابت : شرط لازم برای کارایی، وجود رقابت است. در همة بازارهای عمدة مالی جهان، غیر از تعداد زیاد معاملهکننده تعداد زیادی هم دلال و کارگزار و واسطة متخصص خرید و فروش روی سهام وجود دارد. اینها افراد کارشناس در خرید و فروش هستند و غیر از تخصص، سازمانهایشان هم سرمایه کافی دارند که به حساب خود و برای پرتفوی خودشان سهام و اوراق بهادار دیگر بخرند. این افراد آن پختگی را دارند که تأثیر اطلاعات را بر قیمت سهام بسنجند.
اطلاعات دو طرفه : بازار باید در معرض ترافیکی دوطرفه از اطلاعات باشد، به عبارت دیگر، بازار کارا طوری است که در هر مقطعی از زمان، عدهای در آن خریدارند و عدهای فروشنده. این طور نیست که در زمانی همه خریدار باشند و یا همه فروشنده.
2-2-3- انتقادات وارد شده به نظریه کارایی بازار سرمایه
تجربه عملی : در دنیای واقعی استدلالهای روشنی علیه نظریه کارایی بازار وجود دارد. برای مثال سرمایه گذارهایی وجود دارند که همواره در اکثر موارد سودی بسیار بالاتر از حد متوسط بازار کسب کردهاند. وارن بافت یکی از همین افراد است. استراتژی سرمایه گذاری او خرید سهامی است که قیمت شان پایین تر از حد واقعی است. همچنین تعداد زیادی از مدیران سرمایه گذاری وجود دارند که بهتر از دیگران روندهای قیمت سهام را بازارها شناسایی می کنند و بر همین مبنا سود بالایی کسب می کنند. بنابراین در حالی که چنین مواردی وجود دارد چطور ممکن است عملکرد سرمایه گذاران اتفاقی باشد و از هیچ الگویی پیروی نکند؟
الگوهای یافت شده : در بسیاری از استدلالهایی که علیه نظریه کارایی بازار مطرح شده، آمده است الگوهای مشخص و تکرارشونده ای برای قیمتها وجود دارد. در ادامه به برخی از مثالهای این مورد اشاره میکنیم. تاثیر ژانویه الگویی تکرارشونده است که نشان میدهد در ماه نخست هر سال معمولاً سود بالاتری نصیب سرمایه گذارها میشود. همچنین دوشنبه آبی در وال استریت عبارتی است که خرید سهام را در جمعه بعدازظهر و صبح دوشنبه اشتباه اعلام میکند زیرا طبق الگوی تاثیر آخر هفته قیمت سهام یک روز پیش از تعطیلی آخر هفته و روز بعد از این تعطیلی بالاتر از دیگر ایام هفته است.
رفتار غیر منطقی سرمایه گذاران : مطالعاتی که در زمینه رفتار مالی سرمایه گذاران صورت گرفته و در آن به بررسی تاثیر ویژگیهای شخصیتی سرمایه گذارها بر قیمت سهام پرداخته شده آشکار میکند که برخی الگوهای قابل پیش بینی در بازار سهام وجود دارد. معمولاً سرمایه گذارها مایلند سهامی را بخرند که قیمت آن پایینتر از ارزش واقعی است و برعکس تمایل دارند سهامی را بفروشند که قیمت کنونی آن از ارزش واقعی آن بیشتر است و در بازاری که تعداد زیادی سرمایه گذار در آن وجود دارد هر وضعیتی جز کارایی میتواند حاکم باشد.
2-2-4- پاسخ نظریه کارا
نظریه کارایی بازار احتمال وجود موارد متناقض با قواعد این نظریه را نادیده نمیگیرد. در واقع طبق نظریه یاد شده، قرار نیست قیمت سهام همواره مساوی ارزش واقعی و منصفانه آنها باشد. قیمتها تنها در برخی مواقع و به طور اتفاقی ممکن است بالاتر یا پایینتر از ارزش واقعی شان باشند بنابراین در نهایت قیمتها به حد متوسط شان بازخواهند گشت.
به این ترتیب چون انحراف قیمت از ارزش واقعی حالت اتفاقی دارد، استراتژیهای سرمایه گذاری که باعث کسب سود بالاتر از حد متوسط بازار میشوند همواره موفقیت آمیز نیستند. از سوی دیگر طبق این نظریه کسب سود بالاتر از حد متوسط حاصل تبحر و تجربه سرمایه گذار نیست بلکه شانس باعث این وضعیت شده است. طرفداران نظریه کارایی بازار طبق قوانین احتمالات چنین میگویند: در هر زمان مشخص در بازاری با تعداد زیاد سرمایه گذار، برخی سرمایه گذارها سودی بالا کسب میکنند و برخی نیز همان سود متوسط بازار را می برند.
2-2-5- نتیجه گیری
طرفداران نظریه کارایی بازار معتقدند سرمایهگذارها از هر روند غیرمنطقی در قیمت سهام مادام که وجود دارد برای کسب سود بالاتر از حد متوسط بازار استفاده میکنند. در مواردی نظیر تاثیر ژانویه (الگویی قابل پیش بینی برای تغییرات قیمت) هزینههای بالا در معاملات عمدتاً بیشتر از سود تلاش برای کسب مزیت از این روند است.
در دنیای واقعی بازارها نمیتوانند به طور مطلق کارا یا به طور کامل غیرکارا باشند و بهتر است بازارها را ترکیبی از هر دو حالت تصور کنیم طوری که حوادث و تصمیمهای روزانه همواره فوراً بر قیمت سهام تاثیر نمیگذارند. بنابراین فرض پیش بینی پذیر بودن بازار سرمایه فرضی غیر معقول نبوده و میتوان به تحقیق در این زمینه و بسط روشهای پیش بینی پرداخت.
2-3- داده کاوی
2-3-1- مقدمه
در دنیاي به شدت رقابتی امروز، اطلاعات بعنوان یکی از فاکتورهاي تولیدي مهم پدیدار شده است. در نتیجه تلاش براي استخراج اطلاعات از داده ها توجه بسیاري از افراد دخیل در صنعت اطلاعات و حوزه هاي وابسته را به خود جلب نموده است.
از طرفی امروزه شاهد این هستیم که پس از گذشت بیش از پنج دهه از استفاده از رایانه در ذخیره سازي و تحلیل داد ها و همزمان با پیشرفت فن آوري اطلاعات، هر دو سال یکبار حجم دادهها، دو برابر می شود. همچنین تعداد پایگاههاي داده با سرعت بسیار زیادي رشد می کند. حجم بالاي داده هاي دائما در حال رشد و نیز تنوع آنها به شکل داده متنی، اعداد، گرافیک ها، نقشه ها، عکس ها و تصاویر ماهوارهاي نمایانگر پیچیدگی کار تبدیل دادهها به اطلاعات است. علاوه بر این، تفاوت وسیع در فرآیندهاي تولید داده مثل روش دستی مبتنی بر کاغذ و روش دیجیتالی مبتنی بر کامپیوتر، مزید بر علت شده است. استراتژي ها و فنون متعددي براي گردآوري، ذخیره، سازماندهی و مدیریت کارآمد داده هاي موجود و رسیدن به نتایج معنی دار بکار گرفته شدهاند.
پیشرفتهاي حاصله در تکنولوژي اطلاعات، ابزارهاي جدیدي را براي غلبه بر رشد مستمر بانکهاي اطلاعاتی فراهم می کنند. این پیشرفت ها هم در بعد سخت افزاري و هم در بعد نرم افزاري حاصل شده اند.. ریزپردازندههاي سریع، ابزارهاي ذخیره داد هاي انبوه ، اسکنرها، چاپگرها و دیگر ابزارهاي جانبی، نمایانگر پیشرف هاي حوزه سخت افزار هستند. پیشرفتهاي حاصل در نظا هاي مدیریت بانک اطلاعات در طی دهههاي اخیر نمایانگر تلاشهاي بخش نرم افزاري است.
در نتیجه میتوان اینگونه گفت که امروزه در همه زمینهها با حجم عظیمی از دادهها روبرو هستیم که اگر به دانش تبدیل نشوند هیچ ارزشی ندارند. براي استفاده از آن ها به ابزارهاي کشف دانش نیاز داریم. داده کاوي به عنوان یک توانایی پیشرفته در تحلیل داده و کشف دانش مورد استفاده قرار میگیرد.
داده کاوي یا کشف دانش در پایگاه دادهها علم نسبتا تازه اي است که با توجه پیشرفت کشور در زمینه فناوري اطلاعات و نگاههاي ویژه به دولت الکترونیک و نفوذ استفاده از سیستمهاي رایانهاي در صنعت و ایجاد بانکهاي اطلاعاتی بزرگ توسط ادارات دولتی،دانشگاهها، بانکها و بخش خصوصی نیاز به استفاده از آن به طور عمیقی احساس میشود. داده کاوي یعنی کشف دانش و اطلاعات معتبر پنهان در پایگاههاي داده یا به بیان بهتر به تجزیه و تحلیل ماشینی داده ها براي پیدا کردن الگوهاي مفید و تازه و قابل استناد در پایگاه دادههاي بزرگ، داده کاوي می گویند. داده کاوي در پایگاههاي داده کوچک نیز بسیار پرکاربرد است و از نتایج و الگوهاي تولید شده بوسیله آن در تصمیم گیریهاي استراتژیک تجاري شرکتهاي کوچک نیز میتوان بهرههاي فراوان برد. کاربرد داده کاوي در یک جمله را این گونه میتوان بیان کرد: داده کاوي اطلاعاتی میدهد، که شما براي گرفتن تصمیم هوشمندانهاي درباره مشکلات سخت شغلتان به آنها نیاز دارید.
داده کاوي به عنوان مهمترین کاربرد دادههاي موجود در انبارههاي داده شناخته میشود. در حقیقت داده کاوي دادههاي موجود را مورد تحلیل قرار میدهد تا روندهاي احتمالی، ارتباطهاي غیر محسوس والگوهاي مخفی را از بین انبوه دادهها، شناسایی کند. در واقع هدف از داده کاوي ایجاد مدلهایی براي تصمیم گیري است. این مدلها رفتارهاي آینده را براساس تحلیلهاي گذشته پیش بینی میکنند. در این فرایند از الگوریتمهاي پیچیده ریاضی و آماري استفاده میشود تا دادهها تبدیل به دانش سازمان شوند.
2-3-2- مفهوم داده کاوي
کاوشهاي ماشینی در دادهها یا همان داده کاوي را باید یکی از سامانههاي هوشمند دانست. سامانههاي هوشمند زیر شاخهاي بزرگ و پرکاربرد از یادگیري ماشین هستند. حوزه جدید یادگیري ماشین به واقع همان امتداد و استمرار دانش کهن آمار است که در جهت ماشینی کردن یادگیري، تعلّم، و دانش در حال حرکت است.
عبارت داده کاوي مترادف با یکی از عبارتهاي استخراج دانش، برداشت اطلاعات، وارسی داده ها و حتی لایروبی کردن داده هاست که در حقیقت کشف دانش در پایگاه داده ها را توصیف میکند. کشف دانش در پایگاه دادهها در جهت کشف اطلاعات مفید از مجموعه بزرگ داده هاست. دانش کشف شده میتواند قاعدهاي باشد تا ویژگیهاي دادهها، الگوهایی که به طور متناسب رخ میدهند، خوشه بندي موضوعهاي درون پایگاه داده ها و غیره را توصیف میکند.
یک کاربر سیستم کشف دانش در پایگاه داده ها بایستی درك بالایی از قلمرو داده ها به منظور انتخاب زیر مجموعه صحیحی از داده ها، رده مناسبی از الگوها و معیار خوبی براي الگوهاي جالب داشته باشد. بنابراین سیستم کشف دانش در پایگاه داده ها باید ابزارهایی با اثر تعاملی داشته باشد نه سیستمهاي تجزیه و تحلیل خودکار. لذا کشف دانش از پایگاه دادهها باید مثل یک فرآیند شامل گامهاي زیر باشد:
درك قلمرو
آماده کردن مجموعه دادهها
کشف الگوها
پردازش بعد از کشف الگو
استفاده از نتایج
اصطلاح داده کاوي را آمار شناسان، تحلیل گران دادهها و انجمن سیستمهاي اطلاعات مدیریت به کار می برند، در حالی که پژوهشگران یادگیري ماشین و هوش مصنوعی از کی دي دي 7 بیشتر استفاده میکنند. در ادامه چند تعریف از داده کاوي ارائه می شود:
داده کاوي یا به تعبیر دیگر کشف دانش در پایگاه داده ها، استخراج غیر بدیهی اطلاعات بالقوه مفید از روي داده هایی است که قبلا،ً ناشناخته مانده اند. این مطلب برخی از روشهاي فنی مانند خوشه بندي، خلاصه سازي داده ها، فراگیري قاعده هاي رده بندي، یافتن ارتباط شبکهها، تحلیل تغییرات و کشف بی قاعدگی را شامل میشود.
داده کاوي در حقیقت کشف ساختارهاي جالب توجه، غیر منتظره و با ارزش از داخل مجموعه وسیعی از دادهها میباشد و فعالیتی است که اساسا با آمار و تحلیل دقیق داده ها منطبق است.
2-3-3- مراحل انجام داده کاوي
عمل داده کاوي از یک پایگاه داده به چند مرحله مشخص تقسیم میشود که ما در این بخش پروژه به معرفی و توضیحی مختصر در مورد هر یک از این مراحل اکتفا میکنیم:
تشکیل انبار داده: این مرحله براي تشکیل محیطی پیوسته و یک پارچه جهت انجام مراحل بعدي داده کاوي انجام می گیرد. در حالت کلی انبار داده مجموعه پیوسته و طبقه بندي شده است که دائما در حال تغییر و دینامیک است که براي کاوش آماده میشود.
انتخاب دادهها: در این مرحله براي کم کردن هزینههاي عملیات داده کاوي، داده هایی از پایگاه داده انتخاب می شوند که مورد مطالعه هستند و هدف داده کاوي دادن نتایجی در مورد آنهاست.
تبدیل دادهها: مشخص است براي انجام عملیات داده کاوي لزوما باید تبدیلات خاصی روي دادهها انجام گیرد. ممکن است این تبدیلات خیلی راحت و مختصر مثل تبدیل بایت 8 به عدد صحیح 9 باشد یا خیلی پیچیده و زمان بر و با هزینه هاي بالا مثل تعریف صفات جدید و یا تبدیل و استخراج داده ها از مقادیر رشتهاي.
کاوش در داده ها: در این مرحله است که مدلسازي اصلی داده کاوي انجام می شود. در این مرحله با استفاده از تکنی هاي داده کاوي داده ها مورد کاوش قرار گرفته ، دانش نهفته در آنها استخراج شده و الگو سازي صورت میگیرد.
تفسیر نتیجه: در این مرحله نتایج و الگو هاي ارائه شده توسط ابزار داده کاوي مورد بررسی قرار گرفته و نتایج مفید معین میشود.
ابزارهایی که در فعالیت چهارم به کار گرفته می شوند ممکن است مدلهاي آماري، الگوریتمهاي ریاضی و یا روشهاي یاد گیرنده باشند که کار خود را به صورت خودکار و بر اساس تجربهاي که از طریق شبکه هاي عصبی یا درختهاي تصمیم گیري به دست میآورند بهبود میبخشند.
2-3-4- اهداف داده کاوی
داده کاوي منحصر به گردآوري و مدیریت دادهها نبوده و تجزیه و تحلیل اطلاعات و پیش بینی را نیز شامل میشود. برنامه هاي کاربردي که با بررسی فایلهاي متنی و یا چند رسانهاي به کاوش دادهها می پردازند، پارامترهاي گوناگونی را در نظر میگیرند تا به یکی از الگوهاي زیر برسند:
رابطه: الگوهایی که بر اساس آن یک رویداد به دیگري مربوط میشود، مانند خرید قلم به خرید کاغذ.
ترتیب : الگویی که به تجزیه و تحلیل توالی رویدادها پرداخته و مشخص میکند کدام رویداد، رویدادهاي دیگري را در پی دارد، مانند تولد یک نوزاد و خرید پوشک.
طبقه بندي: شناسایی الگوهاي جدید، مانند همزمانی خرید چسب و پوشه.
براي فهم و برقراري ارتباط با محیط اطرافمان در جهان همواره اشیا ، موجودات و چیزهایی را که با آنها سروکار داریم، دسته بندي، درجه بندي و طبقه بندي میکنیم تا بهتر بتوان روي آنها آنالیز و پردازش انجام داد. میتوان به عنوان مثال حیوانات را به گروهها و نژادهاي مختلف ، مواد را به عناصر سازنده آنها و مایعات مختلف را با توجه به درجه غلظت آنها دسته بندي کنیم.
بر طبق تعریف طبقهبندي عبارت است از : آزمایش ویژگیهاي اشیاء جدید و قرار دادن آنها در مجموعه کلاسهاي از پیش تعریف شده .
به طور معمول اشیایی که طبقه بندي میشوند در قالب رکوردهاي پایگاه دادهها و فیلدهاي آنها پیاده سازي میشوند. پایگاه داده هایی که از اطلاعات ذخیره شده قبلی استفاده میکند ، پایگاه داده آموزشی نامیده میشود و رکوردهاي آن دربرگیرنده چندین خصیصه متفاوت میباشد.
خصیصههاي انتخاب شده را خصیصههاي وابسته و دیگر خصیصهها را پیش گویانه مینامند. مهمترین وظیفه داده کاوي طبقه بندي است. به منظور فهم بهتر و ارتباط راحت تر با دنیا ما همیشه در حال گروه بندي عناصر هستیم. در طبقه بندي کردن اصولا به بررسی خصوصیت یک شی جدید و مرتبط کردن آن با یک مجموعه از قبل تعریف شده می پردازیم. اشیاء طبقه بندي شده به صورت مقداري در داخل پایگاه داده با پر کردن فیلدي به نام کد طبقه معین میشوند. وظیفه طبقه بندي با تعریفی خوب از کلاسها و یک مجموعه آموزشی شامل مثالهاي از قبل تعریف شده میتواند مورد سنجش قرار بگیرد. مثال هایی از طبقه بندي را در زیر میآوریم :
طبقه بندي مشتریان بانک براي گرفتن وام به دو دسته خوب و بد.
طبقه بندي کردن شماره تلفنهایی که به ماشین فاکس متصل میشوند.
طبقه بندي کردن دانش آموزان کلاس بر حسب قد آنها.
در کلیه مثالهاي بیان شده، تعداد محدودي از کلاسهاي تعریف شده وجود دارد و باید هر مقدار به کلاسی تخصیص داده شود.
هدف، ساخت مدلی است که خصیصه هاي پیشگویانه را به عنوان مقدار ورودي و خروجی را براي خصیصه وابسته تعریف نماید. اگر خصیصه وابسته به صورت عددي باشد مسئله را، مسئله برازش می نامند و در غیر این صورت مسئله طبقه بندي نامیده میشود.
محققان مدلهاي مختلف طبقهبندي را همچون شبکههاي عصبی، الگوریتم ژنتیک، روشهاي بایاسین، روشهاي آماري و خطی، جداول تصمیم گیري و مدلهاي ساخت یافته درختی که درختهاي طبقه بندي نیز نامیده میشوند، را پیشنهاد دادهاند.
مثالهایی از وظایف طبقه بندي که از فنون مختلف استفاده میکردند را میتوان به صورت زیر بیان نمود :
تخصیص کلمات کلیدي به مقالات به محض ورود اخبار.
تصمیم گیري راجع به اینکه کدام شماره تلفن وابسته به کدام ماشین فاکس میباشد.
تخصیص کدهاي صنعتی و تعیین مشاغل بر اساس توضیحات شغلی ارائه شده.
در تمامی مثالهاي ذکر شده تعداد کلاسها محدود میباشد و انتظار می رود که قادر به تخصیص هر رکورد به یک یا چندتا از این کلاسها باشیم.
خوشه بندي: کشف و مستند سازي مجموعههاي از حقایق ناشناخته، مانند دسته بندي مشتریان یک فروشگاه بر اساس میزان خرید و زمان بین خریدها.
خوشهبندي در واقع تقسیم بندي یک جمعیت ناهمگون به تعدادي از زیرمجموعههایی که بیشتر همگون هستند میباشد که به آن خوشه اطلاق میشود. هدف خوشه بندي یافتن گروه هایی است که با یکدیگر بسیار متفاوتند ولی اعضاي این گروه ها بسیار شبیه هم هستند.
آن چیزي که خوشه بندي را از طبقه بندي متمایز میکند ، این است که در خوشه بندي بر روي کلاسهاي از پیش تعیین شده کاري انجام نمیشود. در طبقه بندي موضوعات با تخصیص هر عضو یا رکورد به کلاس از پیش تعریف شده بر اساس مدل توسعه یافته در طول آموزش از مثالهاي قبل تشکیل میشوند. در خوشه بندي دیگر هیچ کلاس از پیش تعریف شدهاي وجود ندارد. رکوردها بر اساس شباهتهاي خودشان گروهبندي میشوند و افرادي که خود در آن کار هستند باید این خوشه را تفسیر کنند. غالبا خوشه بندي به عنوان پیش درآمدي براي دیگر فنون داده کاوي یا مدل سازي میباشد. به عنوان مثال خوشه بندي ممکن است اولین قدم در قطعه بندي بازار باشد. پس از یافتن خوشههایی که پایگاه داده را قطعه بندي مینماید، این خوشهها باید براي طبقه بندي دادههاي جدید به کار گرفته شوند. نکته قابل توجه اینکه نباید خوشه بندي را با قطعه بندي اشتباه گرفت.
قطعهبندي به مسائل عمومی شناسایی گروههایی که داراي ویژگیهاي عمومی هستند اطلاق میشود و خوشهبندي روشی براي قطعه بندي دادهها به گروههایی است که از قبل تعریف نشده اند. این در حالی است که طبقه بندي، روشی براي قطعهبندي داده به وسیله تخصیص آنها به گروههایی است که از قبل تعریف شدهاند.
الگوریتمهاي خوشه بندي موجود را میتوان به دو دسته سلسله مراتبی و افرازي تقسیم بندي نمود. در الگوریتمهاي خوشه بندي افرازي میشود که ناحیه خاصی را بهینه میکنند. در کنار آن خوشه بندي سلسله مراتبی، ترتیبی از K افرازي سعی بر تعیین افرازهاست که هر بخش در داخل بخش بعدي و به همین ترتیب قرار گرفتهاند.
پیش بینی: کشف الگوهایی که بر اساس آنها پی بینی قابل قبولی از رویدادهاي آتی ارایه میشود مانند رابطه عضویت در یک باشگاه ورزشی با شرکت در کلاسهاي ورزشی.
پیشگویی نیز همانند مسئله طبقه بندي و یا تخمین میباشد با این تفاوت که پیش بینی با آینده سر و کار دارد یعنی رکوردهایی که طبقه بندي میشوند با توجه به پیش بینیهایی است که از رفتار آینده و یا تخمین مقادیري که در آینده به خود میگیرند، میباشد.
در عمل تنها کاري که میتواند دقت این طبقه بندي را معین کند منتظر ماندن و ملاحظه نتایج در آینده میباشد. هر روشی که در طبقه بندي و تخمین مورد استفاده قرار میگیرد می تواند براي پیش بینی هم استفاده شود مشروط بر آنکه استفاده از مثالهایی که در آنها ارزش متغیر قابل پیش بینی در حال حاضر معلوم باشد و همچنین داده هاي جمع آوري شده براي مثالها در دسترس باشد، این دادههاي قدیمی براي ساخت مدلی که رفتار فعلی مشاهده را بیان میکنند به کار میروند. هنگامی که به این مدل وروديهاي جدید داده شود، نتیجه در واقع پیش بینی رفتار در آینده خواهد بود.
فن تحلیل سبد خرید براي کشف مواردي که با هم به عنوان مثال در یک خواربارفروشی خریداري میشوند به کار میرود و بر همین اساس می تواند مدلی را براي خریدهاي آینده و یا رفتارهایی که احتمال رخ دادن آنها بر روي دادههاي جاري وجود دارد ارائه مینماید.
در زیر به ذکر مثالهایی از وظایف پیش بینی که توسط فنون داده کاوي میتوانند صورت گیرند اشاره میکنیم :
پیش بینی نرخ سهام یا ارز در بازارهاي تجاري.
پیش بینی اینکه کدام مشتري در طول شش ماه آینده از سرویس خاصی استفاده نخواهد کرد.
پیش بینی اینکه کدام مشترك تلفنی درخواست اضافه شدن سرویس جدیدي همچون تماس تلفنی سه نفره یا پست صوتی را به سرویسهاي خود خواهد داشت.
پیش بینی متوسط نمره دانشجویان ترم بعد در درس احتمالات.
از نظر فرایندي نیز میتوان فعالیتهاي داده کاوي را به سه دسته عمومی تقسیم کرد:
اکتشاف: فرایند جستجو در یک بانک داده براي یافتن الگوهاي پنهان بدون داشتن یک فرضیه از پیش تعیین شده درباره اینکه این الگو ممکن است چه باشد. مانند تحلیل هایی که برحسب کالاهاي خریداري شده توسط مشتریان صورت می گیرد، این اطلاعات می تواند به بهبود چیدمان فروشگاه و طراحی تبلیغاتی خاص منجر گردد.
مدل پیش بینی: فرایندي که الگوهاي کشف شده را از بانک داده استخراج میکند و آنها را براي پیش بینی در آینده به کار می برد. به عنوان مثال الگوهاي کشف شده براي پیش بینی فروش در خرده فروشی ها به آنها کمک میکند تا تصمیماتی را در رابطه با موجودي مواد خود اتخاذ کنند.
تحلیلهاي دادگاهی: فرایندي که در آن الگوهاي استخراج شده براي یافتن عوامل نامعقول و متناقض به کار گرفته میشود. به عنوان مثال در موسسات مالی می توانند با تحلیل داد و ستدهاي جعلی گذشته الگوهایی را براي تشخیص و کشف کلاهبرداري در آینده به دست آورند.
در فرآیند بالا، دادههاي خام از منابع مختلفی جمعآوري میشوند و از طریق استخراج، ترجمه و فرآیندهاي بازخوانی به انبار دادهها وارد میشوند. در بخش مهیاسازي دادهها، دادهها از انبار خارج شده و به صورت یک فرمت مناسب براي دادهکاوي درمیآیند. در بخش کشف الگو با روشهاي داده کاوي براي پاسخ به سؤالهاي خاصی که به ذهن میرسند، الگوریتم هایی استخراج میشود و از این الگوریتمها براي ساخت الگو استفاده میشود. در بخش تجزیه و تحلیل الگو، الگوها به یک دانش مفید و قابل استفاده تبدیل میشوند و پس از بهبود آنها، الگوهایی که کارا محسوب میشوند، در یک سیستم اجرایی به کار گرفته خواهند شد.
2-3-5- داده کاوي و رابطه آن با علم آمار
داده کاوي شباهت زیادي به تحلیلهاي آماري دارد، ولی از جهات زیادي با آمار تفاوت داشته و مزیتهاي زیادي نسبت به آمار دارد .جالب ترین تفاوت داده کاوي با تحلیلهاي آماري این است که در آمار ما فرضیهاي طرح میکنیم و با استفاده از تحلیلهاي آماري به اثبات یا رد فرضیه میپردازیم، اما داده کاوي به فرضیه احتیاجی ندارد. در واقع ابزار داده کاوي فرض میکند که شما خود هم نمیدانید به دنبال چه میگردید و این نکتهاي است که باعث میشود کار آمدي داده کاوي در مواقع بروز مشکل نمایان شود. براي مثال ما در آمار فرض میکنیم که دو گروه با هم ارتباط دارند، سپس با استفاده از ضریب هم بستگی پیرسون مشخص می کنیم که ارتباط وجود دارد یا خیر. ولی داده کاوي بدون توجه به اینکه ما اینگونه فرضی داشته باشیم یا نه با کاوش میان دادهها اگر ارتباط مخفی معنی داري وجود داشته باشد آن را به اطلاع ما میرساند. تفاوت بعدي آمار و داده کاوي در این است که آمار فقط می تواند از داده هاي عددي استفاده کند ولی داده کاوي از داده هاي غیر عددي هم استفاده میکند. برنامههاي کاربردي که در زمینه تجزیه و تحلیل اطلاعات به کار میروند از امکاناتی چون پرس و جوي ساخت یافته که در بسیاري از بانکهاي اطلاعاتی یافت میشود و از ابزارهاي تجزیه و تحلیل آماري برخوردار اند، اما برنامههاي مربوط به داده کاوي در عین برخورداري از این قابلیتها از نظر نوع با آنها تفاوت دارند. بسیاري از ابزارهاي ساده براي تجزیه و تحلیل دادهها روشی بر پایه راستی آزمایی را به کار میبرند که در آن فرضیه بسط داده شده، آنگاه دادهها براي تایید یا رد آن بررسی میشوند. به طور مثال ممکن است این نظریه مطرح شود که فردي که یک چکش خریده حتما یک بسته میخ هم خواهد خرید. کارایی این روش به میزان خلاقیت کاربر براي اریه فرضیه هاي متنوع و همچنین ساختار برنامه بکار رفته بستگی دارد. در مقابل در داده کاوي روشهایی براي کشف روابط بکار برده میشوند و به کمک الگوریتمهایی روابط چند بعدي بین داده ها تشخیص داده شده و آنهایی که یکتا یا رایج هستند شناسایی میشوند. به طور مثال در یک فروشگاه سخت افزار ممکن است بین خرید ابزار توسط مشتریان با تملک خانه شخصی یا نوع خودرو، سن، شغل، میزان درآمد یا فاصله محل اقامت آنها با فروشگاه رابطهاي برقرار شود. تفاوتهاي دیگري هم میان آمار و داده کاوي وجود دارد، ولی از آنجایی که هدف این بخش تنها معرفی داده کاوي است و نمیخواهیم به مقایسه داده کاوي و آمار بپردازیم، از ذکر آنها خودداري میکنیم.
2-5- تحلیل تکنیکال
2-5-1- مقدمه:
تحلیل تکنیکی) یا تحلیل فنی (Technical Analysis) روشی برای پیشبینی قیمتها در بازار از طریق مطالعه وضعیت گذشته بازار است. در این تحلیل از طریق بررسی تغییرات و نوسانهای قیمتها و حجم معاملات و عرضه و تقاضا میتوان وضعیت قیمتها در آینده را پیشبینی کرد. این روش تحلیل در بازار ارزهای خارجی، بازارهای بورس اوراق بهادار و بازار طلا و دیگر فلزات گرانبها کاربرد گستردهای دارد.
این نوع تحلیل با استفاده از «مطالعه رفتار و حرکات قیمت و حجم سهام در گذشته و تعیین قیمت و روند آینده سهم» صورت میپذیرد. تغییرات قیمت سهم با استفاده از پیشینه تاریخی و نمودار توسط تحلیل گر تکنیکی مورد تجزیه و تحلیل قرار میگیرد. این روش بیشتر مورد استفاده سفتهبازان قرار میگیرد و بدین صورت قصد دارند تا بازده مورد نظر خود را در هنگام بالا رفتن قیمت سهم افزایش دهند. در واقع سرمایه گذاران با دیدگاه کوتاه مدت از این روش بهره میجویند.
تحلیل تکنیکی (فنی)، با آزمون قیمتهای گذشته و حجم مبادلات حرکتهای آینده، قیمت را پیش بینی میکند. اساس این تحلیلها بر استفاده از نمودار و رابطههای ریاضی و هندسی متمرکز است تا بدین گونه روندهای کوچک و بزرگ بدست آید. در این راستا فرصتهای خرید یا فروش از راه برآورد محدوده نوسانات بازار مشخص میشود.
تحلیل تکنیکی فرایند بررسی قیمتهای تاریخی سهام در کوششی جهت تعیین قیمتهای احتمالی آیندهاست. این کار بوسیله مقایسه روند انتظاری قیمت جاری با حرکت قیمت تاریخی قابل قیاس، انجام میگیرد تا نتیجه معقولی پیشبینی گردد. کارشناسان سنتی ممکن است این فرایند را به عنوان یک حقیقت این طور تعریف کنند که تاریخ خودش را تکرار میکند، حال آنکه دیگران به این گفته بسنده میکنند که باید از گذشته پند بگیریم.
تحلیل تکنیکی دانشی تجربی است که در طی زمان تکامل یافته و افراد بسیاری در رشد و هدایت آن نقش داشتهاند. بدون تردید پایههای تحلیل تکنیکی که امروز به طور گسترده در سراسر دنیا بکار برده میشود، توسط بررسیها و نتیجه گیریهای چارلز داو بنا نهاده شد.
تحلیل تکنیکی یکی از روشهای تحلیل بازار و پیش بینی قیمتهاست. در اصل پیش بینی قیمت به دو روش اصلی امکان پذیر است:تحلیل فاندامنتال و تحلیل تکنیکال
در تحلیل تکنیکال اساس پیش بینی بر مبنای تغییرات تاکنون قیمت و روند تغییر در بازههای زمانی مشخص پایه گذاری شده. معاملهگر با مشاهده چارت قیمتها و استفاده ازاندیکاتورهای لازم برای استراتژی خود، به تحلیل بازار میپردازد. استراتژی روش محاسبه نقاط ورود به بازار و خروج از آن است که معامله گر یا خود به آن دست یافته یا از یافتههای دیگران استفاده میکند. پایه نظر تحلیل گران تکنیکالی این است که وقایع هرچه که باشند اثر خود را بر روی قیمت و در نهایت روی چارت میگذارند بنابراین کسی که چارت را بشناسد فارغ از اخبار و وقایع میتواند معامله کند.
2-5-2- اندیکاتورهای تحلیل تکنیکال
اندیاتورهای تحلیل تکنیکال نیز در واقع شاخص هایی هستند که هر کدام به نحوی اطلاعاتی را در مورد بازار منعکس می کنند، در این مقاله از مشهورترین اندیکاتورها استفاده شده است، جدول 4-2 اندیکاتورهای معروف را مرتب کرده و توضیح کوتاهی در مورد هر یک شرح می دهد.
جدول 4-2 : شرح اندیکاتورهای معروف تحلیل تکنیکال
نام اندیکاتورتوصیففرمول%kاسیلاتور تعریف شده در مدت زمان مشخصCt-LLt-nHHt-n-LLt-n؛در حالی که LLپایین ترین قیمت پایین و HH بالاترین قیمت بالا است%Dمیانگین متحرک اندیکاتور %K0n-1Kt-inSlow %Dمیانگین متحرک اندیکاتور %D0n-1Dt-inMomentumتغیر قیمت سهم در بازه مشخصCt-Ct-4ROCنشانگر میزان رشد در یک بازه مشخصCtCt-n*100William %Rاندازه گیری فروش یا خرید بیش از اندازهHt-CtHt-Lt*100A/D Oscillatorاندیکاتور ویلیام با قیمت روز گذشتهHt-Ct-1Ht-LtDisparity5نشانگر نسبت قیمت و میانگین متحرک پنج روزهCtMA5*100
جدول 4-2 : شرح اندیکاتورهای معروف تحلیل تکنیکال : ادامه جدول
OSCPاندازه گیری تفاوت دو میانگین متحرک مختلفMA10-MA5MA5CCIاندازه گیری اختلاف قیمت سهم از میانگینMt-SMt0.015DtMt=(Ht+Lt+Ct)/3SMt=1nMt-i+1nRSIاسیلاتوری که از صفر تا صد تغیر می کند.100-1001+(0n-1UPt-i/n)(0n-1Dwt-i)در حالی که UP و DW تفاوت قیمت های بالا و پایین در زمان t است
2-6- مرور پژوهش های مشابه
2-6-1- کاربرد شبکه عصبی در پیش بینی قیمت سهام
یون و اسوالز (1991) با توضیح اینکه شبکه عصبی توانایی یادگیری تابعی برای تبدیل کردن ورودی ها به خروجی ها از طریق وزن ها را دارد، کارایی آن را با Multivariate Discriminant Analysis مقایسه کرده و به این نتیجه رسیده است که کارایی شبکه عصبی به صورت معناداری بالاتر از تکنیک رقیب در پیش بینی قیمت می باشد.
وانگ اف.اس و همکاران (1992) تلاش کرد تا از گیت های شبکه عصبی برای پیش بینی بازار سهام، ریسک دارایی های کشوری و طبقه بندی سهام بازار سهام بر مبنای قوانین فازی، قوانین احتمالی و قوانین بولی استفاده کند.
کری زانوسکی و همکاران (1993) تصمیم گرفت تا از شبکه های عصبی در پیش بینی بازده های مثبت و منفی بازار سهام استفاده کند. نتایح به دست آمده حاکی از 72 درصد پیش بینی صحیح در کلاس بندی بازده ها داشته و نسبت به پیش بینی با مدل قدم زدن تصادفی برتری معناداری داشتند.
دونالدسون و کمسترا (1996) به بررسی استفاده از شبکه های عصبی برای تلفیق کردن پیش بینی های مدل های سری های زمانی جهت پیش بینی نوسان پذیری بازارهای سهام در آمریکا می پردازد. همچنین توضیح می دهد که تلفیق به وسیله الگوریتم های غیر خطی شبکه های عصبی نتایج بهتری به دست می آید.
لاورنس (1997) تحقیقی در مورد کارایی شبکه های عصبی در مورد آزمون نظریه کارایی بازار سرمایه انجام داده و در ضمن با مقایسه کارایی شبکه های عصبی در تخمین قیمت اوراق بهادار، به این نتیجه می رسد که این شبکه ها عملکرد بهتری از تکنیک های آماری و رگرسیون دارند.
مشیری و کامرون (2000) به مقایسه کارایی شبکه های عصبی با الگوریتم پس خور بازگشتی و مدل های کلاسیک اقتصادی برای پیش بینی تورم پرداخته و نشان داده است که شبکه های عصبی قادر هستند که تورم را به خوبی مدل های کلاسیک پیش بینی کنند و تفاوت معناداری میان این دو روش پیدا نکرد.
کاناس (2003) به بسط و بررسی مدل های غیرخطی و مدل های خطی برای پیش بینی پرداخته و آنها را بر اساس پیش بینی های نادرست با یکدیگر مقایسه کرده است. وی به مقایسه دو مدل خطی و دو مدل غیر خطی پردخته است که مدل های خطی عبارت از standard regime switching و markov regime switching بوده و مدل های غیر خطی شامل نزدیک ترین همسایگی و شبکه عصبی می باشند. نتایج به دست آمده حاکی از برتری مدل های غیر خطی و در الگوریتم های غیرخطی برتری شبکه عصبی در پیش بینی بازده سهام دارند.
جاسیک و وود (2004) به مطالعه سیگنال های معنادار آماری و پتانسیل های کسب سود برای یک دوره جلوتر در بازار سهام پرداخت به وسیله شبکه های عصبی پرداخته و نتایج نشان دهنده برتری شبکه عصبی نسبت به مدل های کلاسیک در پیش بینی سیگنال های خرید و فروش بودند.
فیش بین (2002) به مبحث زمان بندی بازار سرمایه پرداخته و با طراحی مدلی به پیش بینی نقاط کسب سود و دوری جستن از نقاط افت پرداخته است. در این تحقیق از شبکه عصبی که با الگوریتم ژنتیک بهینه شده است استفاده شده که یک مکانیزم منعطف برای پیش بینی و تعیین استراتژی سرمایه گذاری پرداخته است.
جای و لی (2004) به مطالعه شبکه های عصبی بر مبنای الگوریتم ژنتیک بر مبنای GMT برای مطالعه و شناسایی الگوهای موجود در بازار سرمایه پرداخته و به این نتیجه رسیده است که استفاده از GMT تفاوت معناداری در جواب های به دست آمده از شبکه عصبی ایجاد می کند.
آلتای و ستمان (2005) با مطالعه بازار سهام استانبول به توانایی پیش بینی پذیری بازار از طریق پروسه های یادگیری شبکه عصبی پراخته و نتایح را با متدهای رگرسیون خطی و خرید و نگهداری مقایسه کرده و به برتری شبکه های عصبی در مقایسه با دو الگوریتم دیگر رأی داده است.
مارچسی و مورو (2005) با مطالعه رویکرد نوینی برای اجرای پروسه پیش بینی قیمت سهام که به صورت مفهومی توضیح داده شده بود و از الگوریتم ژنتیک به عنوان معمار شبکه های عصبی استفاده کرده بود پرداخته است. نتایج تحقیق نشان دهنده بهبود جواب های پیدا شده توسط این الگوریتم پیشنهادی داشتند اما این بهبود، معنادار نبود.
پن و تیلاراتن (2005) به بررسی تعدادی از جنبه های انتخاب مشخصه های ورودی و تعداد لایه های پنهان و تعداد نورون های هر لایه در شبکه عصبی عملی برای پیش بینی شاخص بازار سهام استرالیا AORD پرداخت. در این تحقیق که به پیش بینی جهت تغییرات شاخص پرداخته است، شبکه عصبی بهبود یافته توانست تا 80 درصد پیش بینی صحیح داشته باشد.
کیم و همکاران (2005) به بررسی یک متد ترکیبی از شبکه های عصبی تأخیری TDNNs و الگوریتم ژنتیک در زمینه شناسایی الگوهای قیمتی بازار سهام پرداخته و نشان داده است که الگوریتم ترکیبی GA-TDNNs که پیشنهاد شده است داراری عملکرد بهتری نسبت به TDNN استاندارد و شبکه های عصبی معمولی در شناسایی الگو دارد.
کاو و همکاران (2005) از شبکه عصبی مصنوعی برای پیش بینی جهت تغییرات قیمت سهام برای شرکت های حاضر در بورس شانگهای استفاده کرده و نتایج به دست آمده از شبکه های تک متغیره و چند متغیره عصبی حاکی از برتری آنها نسبت به مدل های خطی داشته و این برتری از لحاظ آماری معنادار بوده است. نویسنده نتیجه گرفته است که شبکه های عصبی می توانند در زمینه پیش بینی در بازارهای نوظهور مانند چین خوب عمل کنند.
یاماشیتا و هیراساوا (2005) با استفاده از شبکه عصبی چند شعبه ای برای پیش بینی قیمت سهام و شبیه سازی تغییرات آن استفاده کرده و آزمایش خود را بر روی NIKKEI 225 برای پیش بینی یک دوره جلوتر متمرکز کرده است و در نهایت به برتری معنادار این شبکه عصبی نسبت به مدل های خطی و برتری غیر معنادار نسبت به شبکه های عصبی معمولی رسیده است.
اوکانر و مادن (2006) کارایی استفاده از اندیکاتورهای خارجی همچون قیمت کالا و نرخ مبادله ارز را بر پیش بینی جهت تغییرات قیمت بررسی می کند. مورد مطالعه، شاخص داو جونز بوده و نتایج به دست آمده نشان دهنده افزایش کارایی معنادار شبکه عصبی با وارد شدن متغیرهای خروجی است.
دوتا و همکاران (2006) به مدل سازی بازار سهام هند با استفاده از شبکه های عصبی پرداخته و سپس نتایج را بررسی و کارایی این شبکه را با مدل های کلاسیک مقایسه کرده است. نتایج نشان دهنده برتری شبکه عصبی پیش رو نسبت به مدل های سری زمانی و رگرسیون چند متغیره دارند.
کانتنینو و همکاران (2006) به آنالیز regime switching و شبکه عصبی مصنوعی با معیارهای نوسان پذیری و پیش بینی های خارج از واقعیت در بازار سهام قبرس Cyprus stock exchange پرداخته و با مقایسه مدل های مذکور در دو معیار گفته شده، به این نتیجه رسیده است که شبکه عصبی عملکرد قابل قبول تری را ارائه می کند ولی این عملکرد بهتر از لحاظ آماری معنادار نیست.
بلینسکی و فسرک (2006) قیمت اوراق اختیار را به وسیله شبکه عصبی پس خور بازگشتی مطالعه و پیش بینی رده و نتایج به دست آمده را با مدل بلک شولز black-scholes model، مدل بلک شولز با نوسان ضمنی volatility black-scholes model with pure implied در یک بازه پنج ساله بررسی کرده و نتایج حاکی از برتری معنادار شبکه عصبی پس خور بازگشتی نسبت به الگوریتم های کلاسیک بلک شولز داشتند.
پاندا و وی (2006) به پیش بینی شاخص بازار سهام هند به وسیله شبکه عصبی پرداخته و نتایج آن را با دو مدل کلاسیک شامل مدل قدم زدن تصادفی و مدل خطی اتورگرسیو مقایسه کرده و برای این کار از شش شاخص استفاده کرده است. نویسندگان مقاله به این نتیجه رسیدند که عملکرد شبکه عصبی در مجموع از مدل های رقیب مذکور برتر است.
لیانگ (2006) مطالعه ای بر روی رابطه پیچیده میان جهت تغییرات قیمت و جریان اطلاعات سهام را بر مبنای آنتروپی جریان اطلاعات سهام انجام داده است. شدت جریان اطلاعات سهام و رابطه آن با تغییرات قیمت، توسط شبکه عصبی برآورد و اندازه گیری شده و البته در نهایت رابطه معناداری میان جریان اطلاعات و قیمت سهام شناسایی شد.
کوپلن (2007) با ارائه مدلی برای مدل سازی فرآیند شبکه عصبی در پیش بینی جهت تغییرات قیمت سهام، به مطالعه مشکلاتی در زمینه پیش بینی جهت تغییر قیمت پرداخته است که به وسیله تغییراتی در شبکه عصبی طراحی شده، کاهش یافته و پیش بینی های مالی دقیق تری را ارائه می نماید.
شن و همکاران (2007) با پیشنهاد شبکه عصبی تأخیری با الگوریتم یادگیری adaptive learning و pruning algorithm به پیش بینی تغییرات غیر خطی شاخص سهام پرداخته است. نتایج شبیه سازی و مقایسه نشان می دهد که پیش بینی به این روش نه تنها نسبت به روش های کلاسیک دقیق تر است، بلکه مدلی با پیچیدگی کمتر نیز تخمین می زند.
خان و همکاران (2008) با مقایسه شبکه عصبی پس خور بازگشتی بر مبنای الگوریتم ژنتیک و شبکه عصبی پس خور بازگشتی در مورد مقایسه نرخ تغییرات قیمت سهام، به این نتیجه رسید که شبکه عصبی پس خور بازگشتی بر مبنای الگوریتم ژنتیک عملکرد بهتری نسبت به الگوریتم رقیب خود به صورت معنادار دارد.
یلدیز و همکاران (2008) شبکه عصبی کارای سه لایه با الگوریتم پس خور بازگشتی طراحی کرده و به پیش بینی جهت تغییرات شاخص بازار سهام استانبول پرداخته است. به عنوان نتیجه، دقت پیش بینی انجام شده توسط این شبکه بیش از 74 درصد بوده که نسبت به الگوریتم های کلاسیک برتری معناداری دارد.
اس دی و دی ای (2008) به بررسی سوددهی استراتژی معاملاتی در بازار سهام بر مبنای پیش بینی جهت تغییرات قیمت سهام پرداخته است. نمونه مورد مطالعه شاخص نزدک بوده است و الگوریتم پیشنهادی جهت پیش بینی شاخص نیز شبکه عصبی معرفی شده است. نتایج تحقیق نشان دهنده کارا بودن استراتژی معاملاتی از لحاظ آماری نسبت به روش قدم زدن تصادفی می باشد.
گورسن و کایاکوتلو (2008) کارایی مدل شبکه عصبی، شبکه عصبی جاری، شبکه عصبی دینامیک، و ترکیب شبکه عصبی با الگوریتم های GARCH و EGARCH را مقایسه و بررسی کرده است و برای این بررسی از دو معیار MSE و MAD بهره گرفته شده است. تحقیق مورد نظر در بازار سهام استانبول صورت گرفته است.
سی دی و ام (2009) modified NN را مطالعه و پیش بینی کرده است که استراتژی خرید، نگهداری و فروش به صورت بهینه چگونه باشد تا شاخص بازار سهام بیشترین سود را عاید سرمایه گذار کند. نتایج به دست آمده نشان دهنده کارایی مثبت شبکه نسبت به تحلیل تکنیکال دارد اما این کارایی معنادار نبوده است.
ای ال و همکاران (2009) با اجرا کردن یک مقایسه در بازار سهام برزیل، دو متد شبکه عصبی و adaptive exponential smoothing را مقایسه کرده و موضوع مقایسه را نیز پیش بینی جهت تغییرات شاخص سهام تعیین کرده است. نتایج نشان دهنده برتری معنادار شبکه عصبی بوده است.
کاو و همکاران (2009) نشان می دهد که شبکه های عصبی توانایی از بین بردن غیرخطی بودن موجود در داده های مالی را داشته و می توانند پیش بینی های خوبی را در مورد مدل های پیچیده غیر خطی انجام دهند. نتایج بین شبکه عصبی و متدهای کلاسیک آماری برای بازار سهام پرتغال مقایسه شده است.
2-6-2- کاربرد شبکه عصبی در تعیین استراتژی مبادله سهام
شبکه های عصبی نشان داده اند که قادر به پیش بینی سهام با نوسان بالا و غیرخطی را با قدرت یادگیری بالای خود دارند. شبکه های عصبی پیش رو، متدوال ترین معماری شبکه های عصبی هستند که در پیش بینی سهام به کار می روند. در این شبکه ها جریان اطلاعات فقط در یک جهت، از لایه ورودی به لایه میانی و از لایه میانی به لایه خروجی می باشد.
وایت (1998) با استفاده از شبکه های عصبی پیش رو سه لایه به پیش بینی قیمت سهم IBM پرداختند. آنها از داده های قیمتی 5000 روز برای پیش بینی، که 1000 تای آن جهت آموزش شبکه های عصبی به کار گرفته شدند استفاده کردند. نتایج، به قدر کفایت و در حد مورد انتظار نبود، اما آنها اثبات کردند که شبکه های عصبی کارایی خوبی در پیش بینی بازار سهام دارند.
در مجامدر و حوساین (2000) قیمت بسته شدن شاخص سهام هندوستان توسط شبکه های عصبی پیش بینی شد. در این تحقیق از داده های ده سال برای آموزش و تست شبکه استفاده شده و همچنین نویسندگان یک شبکه عصبی بهینه شده با معماری تلفیقی از شبکه عصبی پس خور بازگشتی سه لایه با ده نورون و شبکه عصبی پیش رو سه لایه با پنج نورون در ادامه طراحی کرده و توانستند بالاترین دقت خود را به 89.65 درصد و میانگین دقت خود را به 69.72 درصد برسانند.
بسیاری از محققان در مورد مقایسه نتایج عملی به دست آمده از شبکه های عصبی مصنوعی و مدل های رگرسیون خطی در پیش بینی سهام پرداخته اند. منتری و همکاران (2010) به مطالعه مقایسه ای نوسان پذیری BSE Sensex 30 و NSE Nifty 50 پرداخته و نتایج به دست آمده از گارچ، ای گارچ، جی گارچ و آی گارچ را با پرسپترون های چند لایه مقایسه کرده است.
GARCH یک مدل توسعه یافته از ARCH می باشد. ARCH یک رویکرد اقتصادی آنالیز نوسانات سری های زمانی در بازارهای مالی می باشد. GARCH برای از بین بردن محدودیت ARCH در کار با محدودیت های غیر منفی به وسیله واریانس شرطی معرفی شده. EGARCH یک توسعه از GARCH و چارچوبی برای مدل کردن نوسانات کمتر از عکس العمل سرمایه گذاران می باشد. IGARCH یک بسط دیگر از مدل GARCH محدود می باشد که تمامی پارامترها را در یک پارامتر تلفیق می کند و لذا یک GARCH تک ریشه ای خوانده می شود.
نویسنده اطلاعات چهارده سال را استفاده کرده و نشان داد که اگرچه نوسانات کسب شده توسط MLP کمتر بوده است، ولی این تفاوت از لحاظ آماری معنادار نبوده است. دونالدسون و کمسترا (1997) نیز کارایی همان مدل ها را با ANN-GARCH مقایسه کرده اند. آنها برای این کار از بازده های روزانه مربوط به چهار بازار بین المللی لندن، توکیو، نیویورک و تورنتو استفاده کرده و نتایج نشان دهنده برتری شبکه عصبی تک لایه نسبت به مدل های دیگر است.
تیلاکاراتن و همکاران (2007) به پیش بینی سیگنال های معملاتی AORD برای یک روز جلوتر پرداخته و به عنوان ورودی از شاخص S&P 500 آمریکا، شاخص FTSE 100 انگلستان، شاخص CAC 40 فرانسه، شاخص DAX آلمان و قیمت بسته شدن خود AORD استفاده کرده اند. برای پیش بینی از دو شبکه عصبی پیش رو و شبکه عصبی احتمالی استفاده کردند و ارزیابی نتایج بر مبنای نرخ کلاس بندی درست سیگنال ها، نشان دهنده برتری هر دو این شبکه ها از مدل های کلاسیک بود.
شیرهلت و دگلی (1996) شاخص S&P 500 را با استفاده از MLP و PROBABLISTIC NN پیش بینی کرده اند. ورودی های این شبکه ها قیمت های بسته شدن S&P 500، و نرخ های مبادلاتی YEN، POUND و مارک برای یک سال بوده است. نتایج نشان دهنده برتری معنادار Probabilistic NN نسبت به MLP بودند.
چارخا (2008) به صورت همزمان به پیش بینی روند سهام و قیمت سهام با استفاده از شبکه های عصبی پیش رو و شبکه های عصبی پس خور بازگشتی پرداخته است. آنها آزمایش خود را بر روی اطلاعات NSE (National Stock Exchange) انجام دادند و نتایج به دست آمده حاکی از برتری شبکه های پس خور نسبت به شبکه های پیش رو در پیش بینی روند به میزان بیست درصد بودند. با این حال شبکه های پیش رو در زمینه پیش بینی قیمت قدرت مندتر تشخیص داده شده و صحت بالاتری در پیش بینی از خود نشان دادند.
سوتی بنجارد و پرم چایسوادی (2010) به پیش بینی بازار سهام تایلند با استفاده از شبکه های پس خور بازگشتی پرداختند. آنها از داده های 124 روزه برای آموزش و معیارهای MSE و MAPE برای اندازه گیری نرخ خطا استفاده کردند. نتایج نشان دادند که شبکه عصبی توانایی بالاتری در کسب سود نسبت به استراتژی های کلاسیک سرمایه گذاری دارد.
در یاو و همکاران (1999)، شاخص سهام کولالامپور با استفاده از شبکه های عصبی پس خور بازگشتی و ورودی های تحلیل تکنیکال و مقادیر شاخص پیش بینی شده است. پایگاه داده از سال 1984 تا 1991 تعیین شده است و نتایج به دست آمده با مدل ARIMA مقایسه شده اند و حاکی از برتری شبکه های عصبی دارند.
تنموژی (2006) بازده روزانه BSE را با استفاده از MLP پیش بینی کرده است. مجموعه داده ها شامل مقادیر BSE برای 17 سال بوده است. آنها به نتایج رضایت بخشی در این مورد رسیده و به این نتیجه رسیدند که مقادیر روز قبل بر پیش بینی روز بعد اثر بسیار زیادی داشته و می تواند به پیش بینی دقیق کمک کند.
ژانگ (2004) جهت پیش بینی سیگنال های خرید و فروش، شبکه عصبی چند لایه پس خور بازگشتی در داده کاوی مالی به کار برده است. پژوهش از داده های هفت ساله شاخص شانگهای از سال 1995 تا 2003 استفاده کرده است. آنها نشان دادند که مدل پیشنهادی از استراتژی خرید و نگهداری بهتر عمل کرده و دقت 85 درصدی از خود نشان می دهد.
یلدیز (2008) از یک شبکه عصبی چند لایه پیش رو همراه با الگوریتم پس خور بازگشتی برای پیش بینی جهت تغییرات سهام استانبول استفاده کرده اند. 1905 مشاهده در این تحقیق استفاده شده و پارامترهای ورودی شامل بالاترین قیمت، پایین ترین قیمت، قیمت بسته شدن و نرخ مبادله دلار می باشند؛ نتایج نشان دهنده دقت 74 درصدی پیش بینی در جهت بوده است.
به منظور بهبود نتایج تحقیقات انجام شده، برخی از محققان به ترکیب الگوریتم پس خور بازگشتی با الگوریتم های دیگر پرداخته اند. در فنگ و چنگ (2009)، محققان برای پیش بینی شاخص شانگهای از Levenberg – Marquardt Backpropagation در یک شبکه پیش رو سه لایه استفاده کردند. نتایج نشان دهنده عملکرد بهتر این الگوریتم نسبت به حالت معمول داشتند.
خان و بندوپادیایا (2008) به مقایسه الگوریتم پس خور بازگشتی با الگوریتم پس خور بازگشتی بر مبنای ژنتیک برای پیش بینی قیمت سهام به صورت روزانه استفاده کردند. نتایج الگوریتم مبتنی بر ژنتیک نسبت به حالت عادی برتری داشت. مجموعه داده ها مربوط به Maruti برای دو سال بودند و دقت کسب شده توسط الگوریتم ژنتیک بنیان 98 درصد در مقابل 93 درصد برتری داشتند.
در مهرآرا و همکاران (2010) نویسندگان به بررسی و مقایسه MLP با الگوریتم پیش رو پس خور بازگشتی و GDMH با الگوریتم ژنتیک برای پیش بینی شاخص سهام تهران (TEPIX) پرداخته و نتایج حاصل از برتری GDMH با الگوریتم ژنتیک داشتند.
یک مطالعه مقایسه ای در قاح (2007) برای شاخص صنعتی داوجونز انجام شد که در آن MLP، adaptive neuro-fuzzy و شبکه های عصبی پیش رو با یکدیگر مقایسه شدند. در این مطالعه، داده های ده ساله داوجونز به صورت میانگین مورد استفاده قرار گرفتند. آنها با مقایسه زمان حل، نرخ بیش برازش و همبستگی ها نشان دادند که که شبکه های عصبی معمولی نسبت به دو الگوریتم دیگر زمان زیادتری برای حل نیاز داشته و بیشتر دچار بیش برازش می شوند.
لی و ژیونگ (2005) به پیش بینی شاخص شانگهای با استفاده از شبکه های عصبی فازی پرداختند. مجموعه داده های استفاده شده مربوط به بازه مارس 2004 تا مارس 2005 بوده و نتایج نشان دهنده برتری شبکه عصبی فازی نسبت به شبکه عصبی معمولی داشتند.
مندژیک و جاروسویک (2007) با استفاده از neuro – evolutionary of NN with GA به پیش بینی بازار سهام آلمان (DAX) پرداخته و به عنوان ورودی از مقادیر DAX، بازار سهام توکیو (NIKKEI 225)، بازار سهام نیویورک (DJIA) و نرخ های مبادلاتی یورو / دلار و دلار / ین استفاده شدند. بازه تحقیق از آپریل 2004 تا آگوست 2004 بوده و نتایج نشان دهنده برتری neuro-evolutionary نسبت به مدل های رقیب خود داشتند.
نائینی و همکاران (2010) به پیش بینی بازار سهام با استفاده از MLP، Elman recurrent NN و feed forward و رگرسیون خطی پرداختند. مجموعه داده های استفاده شده در این تحقیق از سال 2000 تا 2004 برای شاخص بورس تهران بوده و یافته ها، حاکی از برتری MLP NN و رگرسیون خطی داشتند. اما آنها به این نتیجه رسیدند که برای پیش بینی جهت تغییرات، استفاده از Elman recurrent NN و رگرسیون خطی مناسب تر می باشد.
فنگ و همکاران (2006) به پیش بینی شاخص با استفاده از Elman recurrent NN به همراه ژنتیک پرداخت. تحقیق با استفاده از صف های قیمت های باز شدن و بسته شدن سهم shentiandi پرداخته و اعلام کردند که Elman قابلیت بسیار زیادی در تخمین جواب شدنی در پیش بینی بازار سهام دارد.
یاماشایتا (2005) با پیشنهاد یک شبکه عصبی چند شعبه به پیش بینی بازار سهام توکیو پرداختند. آنها اعلام کردند که الگوریتم پیشنهادی دارای قابلیت بالاتری نسبت به شبکه عصبی معمولی در تخمین جواب های با دقت بالا می باشد.
2-6-3- کاربرد داده کاوی در بازار سهام
لیاو و چاو (2013) با توضیح در مورد مزایای سرمایه گذاری در بازارهای بین المللی و تشکیل پرتفوی جهانی از سهام، به بررسی حرکت قیمت سهام در بازار مشترک سهام چین – تایوان ECFA به وسیله داده کاوی پرداخته و با استفاده از تکنیک های قواعد تلازمی و تکنیک های خوشه بندی به خوشه بندی و دسته بندی سهام موجود در بازار پرداختند و در انتها نیز به این نتیجه رسیدند که سهام الکترونیک، مالی و بیمه در بازار تایوان و سهام مسکن، ارتباطات و مالی در بازار هنگ کنگ دارای حرکت قوی و آینده داری در این بازار هستند. آنها برای این مطالعه از بیست شاخص سهام برای خوشه بندی و پیدا کردن قواعد تلازمی استفاده کردند.
لیاو و همکاران (2011) با تأکید بر مزایای سرمایه گذاری در پرتفوهای بین المللی، بیان می کنند که با تمایل جاری نسبت به کار در بازارهای جهانی، اهمیت درک و پیش بینی نرخ مبادله ارز زیادتر می شود. آنها با بررسی رابطه میان نرخ مبادله ارز و شاخص های بازار بین المللی تایوان به وسیله قواعد تلازمی، به تولید قوانینی برای تولید پرتفوهای بهینه سرمایه گذاری در بازار تایوان با در نظر گرفتن نرخ مبادله ارز پرداخته و با استفاده از داده کاوی قوانینی را برای استفاده در روش تشکیل پرتفو مارکویتز تشریح کرده اند.
چنج و کانگ (2014) در تحقیق جالبی سهام را از نظر سرماایه گذاران به دو دسته سهام ارزشمند و سهام در حال رشد، تقسیم کرده و با تعریف دو معیار ارزش دفتری به ارزش بازار و بازده سهام به ترتیب برای سهام ارزشمند و سهام در حال رشد، سهام موجود در بازار تایوان را در چهار دسته قرار دادند که عبارتند از : ارزشمند، با ارزش پایین، با رشد سریع و با رشد پایین. سپس با استفاده از تکنیک داده کاوی سری های زمانی به بررسی چگونگی رفتار سرمایه گذاران با این سهام ها کرده و الگوهایی یافتند. از جمله این الگوها نیز عبارتند از : سهام ارزشمند و با ارزش پایین با عکس العمل بیش از حد سرمایه گذاران، سهام با رشد بالا و با رشد پایین دارای عکس العمل معمولی همراه بوده و سهام ارزشمند به صورت فصلی دارای افت شدیدی هستند.
با استفاده از یک دسته بندی کننده شرکتی، چین و چن (2010) به دسته بندی و پیش بینی قیمت از طریق حجم زیادی از داده های ورودی مثل داده های تحلیل تکنیکال و شاخص های بازار پرداخته اند. مشکلی که الگوریتم دسته بند شرکتی دارد این است که نمی تواند با داده های زیاد کار کند و لذا آنها با طراحی دسته بند مبتنی بر ژنتیک به پیش بینی سیگنال های خرید و فروش پرداختند. نتایج به دست آمده حاکی از توان بالای الگوریتم پیشنهادی و توانایی رقابت آن با بسیاری از متدهای دیگر دسته بندی مثل دسته بندهای آماری داشت.
2-6-4- کاربرد شبکه عصبی و داده کاوی در پیش بینی قیمت سهام
زکیک (1998) نشان داد که دقت شبکه های عصبی بیشتر در بازه 70-80 درصد تغییر می کند. این میزان به نسبت روشهای آماری 5-20 درصد به صورت میانگین، بهتر است. نویسنده در این مقاله به این نتیجه می رسد که در صورت به کارگیری سیستم های خبره در شبکه های عصبی، دقت شبکه های عصبی به صورت میانگین، از میزان ذکر شده نیز بالاتر می رود.
وانستون، فینی و تن (2004) توضیح می دهند که شبکه های عصبی مصنوعی می توانند در تشخیص سهامی که به صورت بالقوه توانایی معناداری از لحاظ شاخص های فاندامنتالی برای رشد دارند؛ به کار روند. همچنین آنها نشان دادند که معماری شبکه های عصبی از الگوریتم های مشابه کلاسیک و هوش مصنوعی که از نورون ها استفاده نمی کنند، بهتر عمل می کنند. در این پژوهش، قواعدی جهت انجام معامله با حد آستانه 50 و بالاتر، توسط شبکه های عصبی پیدا شدند که توانایی رسیدن به 100 درصد اهداف را داشتند. از نتایج دیگر پژوهش، می توان به این اشاره کرد که محققان به این نتیجه رسیدند که با ادامه استفاده از شبکه های عصبی در طول زمان، قدرت پیش بینی این شبکه افزایش می یابد.
آدیا و کلوپی (1998) با مطالعه و بررسی نوزده مقاله به این نتیجه رسیدند که شبکه های عصبی در پیش بینی سهام قدرت بالایی داشته و نسبت به تمام جایگزین های خود عملکرد بهتری را داشته اند.
دشپنده، امراواتی و تاکاره (2010) کاربرد داده کاوی در حوزه های زیادی در مورد تصمیم گیری بررسی کرده و قدرت بالای داده کاوی در بهبود نتایج را تصدیق کرده اند. حوزه های بررسی شده عبارتند از : علوم پزشکی در خصوص تشخیص بیماری، حوزه های ورزشی در خصوص انتخاب بازیکن ها، استراتژی بازی ها، پیش بینی ورشکستگی مالی بانک ها، بهبود پیش بینی تقاضای محصولات، بهینه سازی طبقه بندی، انتخاب کالای مناسب، مقایسه طبقه بندی خرده فروشان و تولید کنندگان، پیش بینی برنامه های تولیدی کارخانجات، تصمیم گیری در مورد قواعد بله / خیر کارهای پیوسته، ایجاد نقشه های تجانسی برای سهام داران و سرمایه گذاران.
نی (2008) بسیاری از متدهای شبکه های عصبی در داده کاوی را تشریح کرده است. نویسنده در این تحقیق به بررسی فرآیند داده کاوی بر پایه شبکه های عصبی پرداخته است. وی با تمرکز بر روی کاربردهای مختلف داده کاوی بر مبنای شبکه های عصبی، به توضیح دیدگاه ها و تکنیک هایی برای به کارگیری داده کاوی بر مبنای شبکه های عصبی می پردازد.
وایس لا و باهات (2010) ثابت کردند که شبکه های عصبی نسبت به روشهای آماری در پیش بینی قیمت سهام عملکرد بهتری دارند. آنها آزمایشی بر مبنای طراحی متدی جهت پیش بینی قیمت روزانه سهام طراحی کرده و نتایج به دست آمده از شبکه های عصبی و متدهای آماری را مقایسه کردند. آنها ثابت کردند که در صورتی که شبکه عصبی به درستی آموزش ببیند، به درستی طراحی شود، ورودی ها و خروجی های مناسب را داشته باشند می توانند به خوبی قیمت را پیش بینی کنند. علاوه بر این برتری تکنیک معرفی شده توسط نویسندگان، با پیچیده شدن مدل نسبت به روش های آماری بیشتر هم شد و بنابراین شبکه های عصبی می توانند به عنوان یک جایگزین مناسب برای پیش بینی قیمت سهام به صورت روزانه به کار روند.
آرکی و دی دی (2010) تلاش کردند تا با تجمیع قابلیت های شبکه های عصبی، به پیش بینی بازار سهام بپردازند. محققان، با اعتراف به اینکه پیش بینی شاخص قیمت های جهانی کاری مشکل است، در این مقاله با تکیه بر قابلیت های شبکه های عصبی به پیش بینی شاخص قیمت سهام می پردازند. آنها با بررسی مدلهای کلاسیک و نوین سری های زمانی به این نتیجه رسیدند که پیش بینی با این مدل ها دارای چالش های فراوانی بوده و شبکه های عصبی برای این کار مناسب تر است. شبکه های عصبی این قابلیت را دارند که داده های مفید را از میان حجم بالای داده ها استخراج کنند. پژوهشگران در این تحقیق، با بررسی ادبیات انجام شده در زمینه کاربرد شبکه های عصبی در پیش بینی قیمت سهام، به این نتیجه رسیدند که شبکه های عصبی برای پیش بینی قیمت سهام بسیار مفید هستند.
رازی و اتاپیلی (2005) اثبات کردند که شبکه های عصبی و دسته بندی و رگرسیون به وسیله درخت تصمیم(cart)، پیش بینی های بهتری از رگرسیون غیر خطی انجام می دهند. آنها همچنین به این نتیجه رسیدند که شبکه های عصبی و الگوریتم های دسته بندی و رگرسیون درخت تصمیم، در زمینه کار با متغیرهای باینری و اسمی و همچنین متغیرهای پیوسته قابلیت های بهتری نسبت به رگرسیون دارند. در هر حال، نتایج این تحقیق حاکی از برتری هیچ یک از شبکه های عصبی و مدل های رگرسیون و دسته بندی درخت تصمیم نمی باشد.
لو (2010) از طریق نتایج عملی اثبات کرد که آنالیز اجزاء مستقل یکپارچه (ica) بر مبنای نقشه فیلترینگ اغتشاش های موجود در میان داده ها به همراه شبکه های عصبی جهت پیش بینی قیمت، عملکرد بهتری نسبت به فیلترینگ بر اساس امواج الیوت به همراه شبکه های عصبی، شبکه های عصبی به تنهایی و مدل قدم زدن تصادفی دارد. بر مبنای نتایج به دست آمده، نویسنده نتیجه می گیرد که متد پیشنهادی می تواند برای شناسایی و از بین بردن اغتشاشات موجود در قیمت سهام و بهبود کارایی شبکه های عصبی کارایی مناسبی داشته باشد.
رای و رای (2011) از طریق مقایسه، کشف کردند که مسئله پیش بینی شاخص سهام یکی از بزرگترین و مهمترنی چالش ها به عنوان هدفی برای بسیاری از متدها در حوزه مالی و اقتصاد است. در مقاله آنها، انواع مختلف شبکه های عصبی برای پیش بینی قیمت سهام با هم مقایسه شده اند. از جمله این متدها می توان به شبکه های عصبی مبتنی بر arima، شبکه های عصبی مبتنی بر الگوریتم ژنتیک و شبکه های عصبی چند شاخه ای اشاره کرد. نویسندگان همچنین به مقایسه عملکرد این معماری ها با یکدیگر پرداخته اند.
فهرست مراجع
Adya, M., Collopy, F., 1998. How effective are Neural Networks at Forecasting and Prediction? A Review and Evaluation. Journal of Forecasting, J. Forecast, 1(7), pp. 481 – 495.
Altay, E., Satman M. H., 2005. Stock market forecasting: artificial neural network and linear regression comparison in an emerging market. Journal of financial management and papers. Available from:http://papers.ssrn.com/sol3/DisplayAbstractSearch.cfm
Armano, G., Marchesi, M., Murru, A., 2005. A hybrid genetic-neural architecture for stock indexes forecasting. Journal of Information Sciences Elsevier, 3(4), pp. 54-61.
Bisoi, R., Dash, P. K., 2014. A hybrid evolutionary dynamic neural network for stock market trend analysis and prediction using unscented Kalman filter. Journal of Applied Soft Computing, 3(19), pp. 41-56
Bruce, J., stone, V., Finnie, G., Tan, C., 2004. Applying Fundamental Analysis and Neural Networks in the Australian Stockmarket Bond University. ePublications@bond, Available from http://bond.edu.au/library-and-online-resources/search/bond-university-research
Cao, J., Liang, J., 2004, Boundedness and stability for Cohen–Grossbergneural network with time-varying delays. Journal of Mathematical Analysis and Applications Elsevier, 2(5), pp. 78-84.
Cao, J., Wang, J., 2005. Global asymptotic and robust stability of recurrent neural networks with time delays. Circuits and Systems I: Regular Papers. Available from http://ieeexplore.ieee.org/xpl/RecentIssue.jsp?punumber=13
Chang, C., Yon, W., Chen, Y. L., 2010. Mining associative classification rules with stock trading data – A GA-based method. Available from Knowledge-Based Systems, Volume 23(6), pp. 605-614
Chann, C. P., Wang, D. D., Zhou, CH. L., 2012. A novel model by evolving partially connected neural network for stock price trend forecasting. Journal of Expert Systems with Applications, 39(1), pp. 611-620.
Charkha, P. R., 2008. Stock Price Prediction and Trend Prediction Using Neural Networks. Journal of First International Conference on Emerging Trends in Engineering and Technology, 3(7), pp. 592-594.
Chi-Jie, L., 2010. Integrating independent component analysis-based denoising scheme with neural network for stock price prediction. Journal of Expert Systems with Applications, 37(10), pp. 7056-7064.
Connor, N. O. M. G., 2006. A neural network approach to predicting stock exchange movements using external factors. Journal of Knowledge-Based Systems Elsevier, 3(8), pp. 87-94
Coupelon, O., 2007. Neural network modeling for stock movement prediction: a state of the art, Neural Network Modeling For stockresearch. Available from http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6719576
Dase, R. K., Pawar, D. D., 2010. Application of Artificial Neural Network for stock market predictions: A review of literature. International Journal of Machine Intelligence, ISSN: 0975–2927, 2(2), pp. 14-17
Deshpande, S. P., Thakare, V. M., 2010, DATA MINING SYSTEM AND APPLICATIONS: A REVIEW. International Journal of Distributed and Parallel systems (IJDPS), 1(1), pp. 145-151
Donaldson, R. G., Kamstra, M., 1997. An artificial neural network- GARCH model for international stock return volatility. Journal of Empirical Finance, 4(1), pp. 17-46
Donaldson, R. G., Kamstra, M., 1996. Forecast combining with neural networks. Journal of Forecasting, 3(5), pp. 45-51
Dutta, G., Jha, P., Laha, A. K., Mohan, N., 2006. Artificial neural network models for forecasting stock price index in the Bombaystock exchange. Journal of Emerging Market, 4(2), pp. 23-30
Fagner A., Oliveira, D., Nobre, C. N., Zárate, L. E., 2013. Applying Artificial Neural Networks to prediction of stock price and improvement of the directional prediction index – Case study of PETR4. Journal of Petrobras, Brazil, Expert Systems with Applications, 40(18), pp. 7596-7606
Fang, Y. X., Wang, B. W., Wang, Y. M., 2006. The stock index forecast based on dynamic recurrent neural network trained with GA. The 20th Pacific Asia Conference on Language, Information and Computation, Wuhan, China, pp. 342-350
Faseruk, A., Blynski, L., 2006. Comparison of the effectiveness of option price forecasting: Black-Scholes vs. simple and hybrid neural networks. Journal of Financial Management, 2(5), pp. 23-31
Feng, L., Cheng, L., 2009. Application Study of BP Neural Network on Stock Market Prediction. Ninth International Conference on Hybrid Intelligent Systems, pp. 174-178
Fishbein, D. S., 2002. Neural Networks and Genetic Algorithms: Another Tools for the Technical Analysis of Financial Markets. Trenton Computer Festival Proceedings. Available from:http://www.nquant.com
Guresen, E., Kayakutlu, G., Daim, T. U., 2011. Using artificial neural network models in stock market index prediction. Journal of Expert Systems with Applications Elsevier, 3(2), pp 124-129
Huang, N. E., Shen, Z., Long, S. R., 1998. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis. Journal of the Royal rspa.royalsocietypublishing, 5(1), pp. 142-149
Jasemi, M., Kimiagari, A. M., Memariani, A., 2011. A modern neural network model to do stock market timing on the basis of the ancient investment technique of Japanese Candlestick. Journal of Expert Systems with Applications, 38(4), pp. 3884-3890.
Jasic, T., Wood, D., 2004. The profitability of daily stock market indices trades based on neural network predictions: Case study for the S&P 500, the DAX, the TOPIX and the FTSE in the period. Journal of Applied Financial Economics, Taylor & Francis, 5(7), pp. 55-62
Jie Lu, CH., 2010. Integrating independent component analysis-based denoising scheme with neural network for stock price prediction. Expert Systems with Applications, 37(10), pp. 7056-7064
Kara, Y., Boyacioglu, M. A., Baykan, O. K., 2011. Predicting direction of stock price index movement using artificial neural networks and support vector machines: The sample of the Istanbul Stock Exchange. Journal of Expert Systems with Applications, 38(5), pp. 5311-5319
Khan, A. U., Bandopadhyaya, T. K., Sharma, S., 2008. Genetic Algorithm Based Backpropagation Neural Network Performs better than Backpropagation Neural Network in Stock Rates Prediction. International Journal of Computer Science and Network Security, 8(7), pp. 54-61
Khan, J., Wei, J. S., Ringner, M., Saal, L. H., 2001. Classification and diagnostic prediction of cancers using gene expression profiling and artificial neural networks. Nature medicine. Available from: http://www.nature.com/siteindex/index.html
Kim, B. S., 2005. Nonlinear flight control using neural networks. Journal of Guidance, Control, and Dynamics, 4(24), pp. 113.122
Kim, K., Lee, W. B., 2004, Stock market prediction using artificial neural networks with optimal feature transformation, Journal of Neural computing & applications Springer, 3(4), pp. 54-61
Kryzanowski, L., Galler, M., Wright, D. W., 1993. Using artificial neural networks to pick stocks. Journal of Financial Analysts Journal JSTOR, 6(4), pp. 45-54
Lahmiri, S., 2013. Wavelet low- and high-frequency components as features for predicting stock prices with backpropagation neural networks. Journal of King Saud University - Computer and Information Sciences, 14(7), pp. 65-72
Li, R. J., Xiong, Z. B., 2005. Forecasting stock market with fuzzy neural networks. Proceedings of 2005 International Conference on Machine Learning and Cybernetics, pp. 3475-3479.
Liao, SH. H., Chou, SH. Y., 2013. Data mining investigation of co-movements on the Taiwan and China stock markets for future investment portfolio. Expert Systems with Applications 40(5), pp. 1542-1554
Liao, SH. L., Chu, P. H., You, Y. L., 2011. Mining the co-movement between foreign exchange rates and category stock indexes in the Taiwan financial capital market. Expert Systems with Applications, 38(4), pp. 324-331
Mandziuk, J., Jaruszewicz, M., 2007. Neuro-evolutionary approach to stock market prediction. International Joint Conference on Neural Networks, pp. 2515-2520.
Mantri, J. K., Gahan, P., Nayak, B. B., 2010. Artificial Neural Networks an Application to Stock Market Volatility. International Journal of Engineering Science and Technology, 2(5), pp. 1451-1460
Mehrara, M., Moeini, A., Ahrari, M., Ghafari, A., 2010. Using Technical Analysis with Neural Network for Prediction Stock Price Index in Tehran Stock Exchange. Middle Eastern Finance and Economics, vol. 6(6), pp. 50-61
Salim, L. 2013. Wavelet low- and high-frequency components as features for predicting stock prices with Backpropagation neural networks. Journal of King Saud University - Computer and Information Sciences, 4(1), pp. 214-223
Pei, C., Wang, D., Chang, L. 2012. A novel model by evolving partially connected neural network for stock price trend forecasting. Expert Systems with Applications, 39(1), pp. 611-620
Shu-Hsian, L., Shan-Yuan, C. 2013. Data mining investigation of co-movements on the Taiwan and China stock markets for future investment portfolio, Expert Systems with Applications, 40(5), pp. 1542-1554
Shu-shine. L., Pei-hoi, C., Ying-lu, Y., Mining the co-movement between foreign exchange rates and category stock indexes in the Taiwan financial capital market. Expert Systems with Applications, 38(4), pp. 127.136
O'Connor, N., Madden, M. 2006, A neural network approach to predicting stock exchange movements using external factors. Knowledge-Based Systems Elsevier, 5(21), pp.345-356
Yamashita, K. 2005. Application of multi-branch neural networks to stock market prediction, Journal of Neural Networks and data series, 45(4), pp.57-65
Yoon, Y., Swales, T. 1993. A comparison of discriminant analysis versus artificial neural networks, TM Margaric - Journal of the Operational Research – JSTOR, 27(3), pp.194-206