در بازار سهام ، پیش بینی روند سری قیمت یکی از مشکلات گسترده و چالش برانگیز برای سرمایه گذاران و محققان است. به دلیل مدت زمان های مختلف عوامل تأثیر و رفتارهای معاملاتی معامله گران ، در سری زمانی مالی چندین ویژگی در مقیاس زمانی وجود دارد. در این مقاله ، ما یک شبکه عصبی ترکیبی پایان به پایان به پایان ، یک مدل مبتنی بر یادگیری ویژگی در مقیاس زمانی چندگانه را برای پیش بینی روند قیمت شاخص بازار سهام پیشنهاد می کنیم. در مرحله اول ، شبکه عصبی ترکیبی دو نوع ویژگی را در مقیاس های مختلف از طریق لایه های اول و دوم شبکه عصبی حلقوی (CNN) ، همراه با سری قیمت خام روزانه ، منعکس می کند ، ویژگی های نسبتاً کوتاه ، میان مدت و بلند مدت را منعکس می کنددر دنباله قیمت. ثانیا ، با توجه به وابستگی های زمانی موجود در سه نوع ویژگی ، شبکه عصبی ترکیبی پیشنهادی سه شبکه عصبی مکرر کوتاه مدت (LSTM) را برای گرفتن چنین وابستگی ها به دست می آورد. سرانجام ، از لایه های کاملاً متصل برای یادگیری بازنمایی های مشترک برای پیش بینی روند قیمت استفاده می شود. شبکه عصبی ترکیبی پیشنهادی اثربخشی خود را با عملکرد بهتر از مدل های معیار در مجموعه داده واقعی نشان می دهد.
1. مقدمه
روند شاخص بورس سهام به حرکات رو به بالا یا رو به پایین سری قیمت در آینده اشاره دارد. پیش بینی دقیق روند شاخص بورس سهام می تواند به سرمایه گذاران کمک کند تا از خطرات خودداری کنند و بازده بالاتری را در بورس به دست آورند [1]. از این رو ، به یک میدان داغ تبدیل شده و توجه بسیاری از محققان را به خود جلب کرده است.
در حال حاضر ، بسیاری از تکنیک ها و مدل های مختلف برای پیش بینی شاخص بازار سهام اعمال شده است. مانند مدلهای آماری سنتی [2،3] ، روشهای یادگیری ماشین [3،4] ، شبکه های عصبی مصنوعی (ANN) [5،6،7،8] و غیره. با توسعه یادگیری عمیق ، روش های زیادی وجود داردبر اساس یادگیری عمیق مورد استفاده برای پیش بینی سهام و نتیجه گیری های اساسی را به دست آورده است [9،10،11،12،13،14،15،16،18،19،20،21،22].
مطالعات فوق از روی ویژگی های مقیاس زمانی تک شاخص بورس انجام شده است، اما برای مطالعه از ویژگی های مقیاس زمانی چندگانه نیز معنادار است. ویژگی های مقیاس زمانی متعددی در شاخص بورس وجود دارد. از یک سو، بازار سهام تحت تأثیر عوامل بسیاری از جمله فضای اقتصادی، سیاست سیاسی، توسعه صنعتی، اخبار بازار، عوامل طبیعی و غیره است. و مدت زمان عوامل با یکدیگر متفاوت است. از سوی دیگر، هر سرمایهگذار چرخه سرمایهگذاری متفاوتی دارد، مانند سرمایهگذاری بلندمدت و کوتاهمدت. بنابراین می توان ویژگی های مقیاس های زمانی متعدد را در شاخص بورس مشاهده کرد. در میان آنها، ویژگی های مقیاس زمانی طولانی می تواند منعکس کننده روند بلند مدت قیمت باشد، در حالی که ویژگی های مقیاس زمانی کوتاه می تواند نوسان کوتاه مدت قیمت را منعکس کند. ترکیب ویژگی های چند مقیاسی پیش بینی دقیق را تسهیل می کند.
در سال های اخیر، شبکه عصبی کانولوشن (CNN) قدرت بالایی در استخراج ویژگی نشان داده است. با الهام از تحقیقات موجود، ما از یک CNN برای استخراج چندین ویژگی مقیاس زمانی برای یادگیری جامع تر از توالی قیمت استفاده می کنیم. به عنوان مثال، سری قیمت بسته شدن روزانه در شکل 1a توسط یک شبکه عصبی کانولوشنال دو لایه آموخته شده است. خروجی های دو لایه CNN به ترتیب Feature map1 و Feature map2 نامیده می شوند. همانطور که در شکل 1b نشان داده شده است، هر نقطه از نقشه ویژگی مربوط به منطقه ای از سری قیمت اصلی است (که فیلد گیرنده [23] نامیده می شود)، و می تواند به عنوان توصیف منطقه در نظر گرفته شود. با توجه به فیلدهای دریافتی متفاوت، Feature map1 و Feature map2 سری قیمت ورودی را از مقیاس های دو زمانه توصیف می کنند. در مقایسه با Feature map1، Feature map2 توالی قیمت اصلی را در مقیاس زمانی بزرگتر توصیف می کند. بنابراین، ما خروجیهای لایههای مختلف CNN را به عنوان ویژگیهای مقیاسهای زمانی متغیر سری قیمت اصلی در نظر میگیریم.
در همین حال، شبکه حافظه کوتاهمدت بلند مدت (LSTM) به دلیل مکانیسم حافظه داخلی روی دادههای توالی با وابستگیهای بلندمدت به خوبی کار میکند [24،25]. بسیاری از مطالعات از شبکه های LSTM برای یادگیری رابطه بلندمدت ویژگی های استخراج شده توسط CNN استفاده می کنند. به این ترتیب، ما از LSTM ها برای یادگیری وابستگی های طولانی مدت توالی ویژگی های مقیاس زمانی متعدد به دست آمده توسط CNN استفاده می کنیم.
در این مقاله ، ما یک شبکه عصبی ترکیبی پایان به پایان به پایان برای یادگیری چندین ویژگی مقیاس زمانی برای پیش بینی روند شاخص بورس سهام ارائه می دهیم. این شبکه ابتدا ویژگی های به دست آمده از لایه های مختلف CNN را با پی در پی قیمت های روزانه ترکیب می کند تا ویژگی های مختلف مقیاس زمانی را شکل دهد و منعکس کننده قوانین کوتاه مدت ، میان مدت و بلند مدت سری قیمت باشد. پس از آن ، از سه شبکه عصبی مکرر LSTM برای ضبط وابستگی های زمانی در ویژگی های مقیاس زمانی چندگانه به دست آمده در مرحله قبل استفاده می شود. سپس ، چندین لایه کاملاً متصل ، ویژگی های آموخته شده توسط LSTMS را برای پیش بینی روند شاخص بازار سهام ترکیب می کنند. تجزیه و تحلیل تجربی مجموعه داده های واقعی نشان می دهد که شبکه ترکیبی پیشنهادی از نظر پیش بینی روند در دقت ، از خطوط مختلف بهتر عمل می کند.
بقیه مقاله به شرح زیر سازماندهی شده است. بخش 2 کارهای مرتبط را ارائه می دهد. در بخش 3 ، ما شبکه عصبی ترکیبی پیشنهادی را بر اساس ویژگی های مقیاس زمانی چندین شاخص بازار سهام ارائه می دهیم. بخش 4 آزمایش ها و نتایج را گزارش می کند ، و مقاله در بخش 5 مورد بحث قرار می گیرد.
2. کار مرتبط
از روشهای سنتی گرفته تا مدل های یادگیری عمیق ، تکنیک های بی شماری در مورد پیش بینی سری زمانی مالی وجود دارد که از این میان یادگیری عمیق به دلیل عملکرد بیش از حد مورد توجه گسترده ای قرار گرفته است.
LSTM ترجیح داده شده ترین مدل یادگیری عمیق در مطالعات پیش بینی سری های زمانی مالی است. LSTM می تواند وابستگی ها را در سری های زمانی توسط مکانیزم حافظه داخلی استخراج کند. در [11]، شبکه های LSTM برای پیش بینی حرکات جهتی خارج از نمونه برای سهام تشکیل دهنده S& P 500 استفاده شد. آنها دریافتند که شبکه های LSTM از روش های طبقه بندی بدون حافظه عملکرد بهتری دارند. سی و همکاران[12] یک مدل معاملاتی برای بازار آتی چین از طریق DRL و LSTM ساخت. آنها از شبکه های عصبی عمیق برای کشف ویژگی های بازار استفاده کردند. سپس یک LSTM برای اتخاذ تصمیمات معاملاتی مستمر اعمال شد. بائو و همکاران[13] از تبدیل موجک و رمزگذارهای خودکار پشتهای برای یادگیری اطلاعات مفید در شاخصهای فنی و استفاده از LSTM برای یادگیری وابستگیهای زمانی برای پیشبینی قیمت سهام استفاده کنید. در [14]، اطلاعات دفتر سفارش محدود و تاریخچه به مدل LSTM برای تعیین حرکات قیمت سهام وارد شد. تسانتکیدیس و همکاران[15] از کتاب سفارش حد و مدل LSTM برای پیشبینی روند استفاده کرد. این آثار ثابت می کنند که LSTM ها می توانند با موفقیت وابستگی های زمانی را در دنباله مالی استخراج کنند. با این حال، این آثار ویژگی های مقیاس زمانی متعدد را در سری قیمت در نظر نمی گیرند.
چندین مطالعه بر استفاده از مدلهای CNN با الهام از دستاوردهای قابل توجه آنها در زمینههای دیگر، مانند تشخیص تصویر [26]، پردازش گفتار [27]، پردازش زبان طبیعی [28] و غیره متمرکز شدهاند. شبکههای عصبی کانولوشن میتوانند مستقیماً ویژگیهای ورودی را بدون نیاز به استخراج استخراج کنند. پیش پردازش پیچیده، و می تواند به طور موثر داده های پیچیده مختلف را پردازش کند. چن و همکاران[16] از CNN یک بعدی با الگوریتم RL مبتنی بر عامل برای مطالعه آتی شاخص سهام تایوان استفاده کرد. در [17]، Siripurapu و همکاران. توالی قیمت را به عکس تبدیل کنید و سپس از CNN برای یادگیری ویژگی های مفید برای پیش بینی استفاده کنید. در [18]، یک مدل CNN جدید برای پیش بینی روند قیمت سهام پیشنهاد شد. همبستگی بین نمونه ها و ویژگی ها برای مرتب کردن ویژگی ها قبل از ارائه آنها به عنوان ورودی به CNN استفاده می شود. این آثار از CNN برای استخراج ویژگیهای یک مقیاس زمانی واحد در سری قیمت استفاده میکنند. اما در سریهای زمانی مالی، ویژگیهای مقیاس زمانی متعدد در همه جا وجود دارند و مطالعه آنها معنادار است.
علاوه بر این ، برخی از مطالعات وجود دارد که مزایای CNN و LSTM را برای تشکیل شبکه های ترکیبی ترکیب می کند. در [19] ، مدل پیشنهادی استراتژی انتخاب سهام را با استفاده از CNN انجام می دهد و سپس با استفاده از LSTM استراتژی زمان بندی را انجام می دهد. وانگ و همکاران.[20] یک مدل یادگیری شبکه سرمایه گذاری عمیق (DEEPCNL) را ارائه داد ، که لایه های عصبی حلقوی و مکرر را ترکیب می کند. هر دو [19،20] از ترکیب CNN و LSTM استفاده می کنند. با این حال ، آنها ویژگی های مقیاس زمانی چندگانه موجود در سری زمانی مالی را نادیده می گیرند. در [21] ، خطوط لوله بیشماری که CNN و LSTM دو جهته را برای پیش بینی شاخص بازار سهام بهبود می بخشند. در [22] ، هر دو نورون حلقوی و مکرر برای ساخت ساختار چند فیلتر یکپارچه شده اند ، به طوری که می توان اطلاعات مربوط به فضاهای مختلف و دیدگاه های بازار را بدست آورد. اگرچه نویسندگان در [21،22] مدل های پیشنهادی بر اساس ویژگی های چند مقیاس ، آنها از خطوط لوله یا شبکه های متعدد برای استخراج ویژگی های چند مقیاس استفاده می کنند ، که این مدل را پیچیده و وسیع می کند ، که این امر برای آموزش یا به دست آوردن اطلاعات مفید مساعد نیست.
متفاوت از کار قبلی ، ما یک شبکه عصبی ترکیبی را پیشنهاد می کنیم که عمدتاً بر روی ویژگی های مقیاس زمانی در سری زمانی مالی برای پیش بینی روند متمرکز است. ما به طور ابتکاری از CNN برای استخراج ویژگی ها در مقیاس های مختلف ، ساده سازی مدل و تسهیل پیش بینی های بهتر استفاده می کنیم. سپس از چندین LSTM برای یادگیری وابستگی های زمانی در توالی های ویژگی استخراج شده توسط CNN و لایه های کاملاً متصل برای انتزاع ویژگی سطح بالاتر استفاده می کنیم.
3. شبکه عصبی ترکیبی بر اساس یادگیری ویژگی های مقیاس زمانی چندگانه
در این بخش ، تعریف رسمی از مشکل یادگیری و پیش بینی روند را ارائه می دهیم. سپس ، ما شبکه عصبی ترکیبی پیشنهادی را بر اساس یادگیری ویژگی های مقیاس زمانی چندگانه ارائه می دهیم.
3. 1فرمول مسأله
در بازار سهام 5 روز معاملاتی در هفته و 20 روز معاملاتی در ماه وجود دارد. سرمایه گذاران معمولاً بعد از یک هفته یا یک ماه به حرکات قیمت علاقه مند هستند. بنابراین ما برای 40 روز متوالی برای پیش بینی روند بسته شدن قیمت در روزهای معاملاتی N ، که در آن مقادیر N 5 (در هفته) و 20 (یک ماه) است ، از یک سری قیمت های پایانی استفاده می کنیم. به طور رسمی ، ما دنباله قیمت های پایانی تاریخی را به عنوان x i = تعریف می کنیم< x i + 1 , x i + 2 , ⋯ x i + t , ⋯ x i + 40 >، جایی که x i + t ارزش قیمت بسته شدن در روز (i + t) است. در همین حال ، روند رو به بالا یا رو به پایین که باید پیش بینی شود ، با قانون زیر تعریف می شود:
در جایی که من روند بسته شدن قیمت را در هفته (5 نفر) یا یک ماه (20 نفر) بعداً نشان می دهم ، 0 نشان دهنده روند نزولی است ، و 1 نشان دهنده روند صعودی است ، X I + 40 ارزش قیمت بسته شدن آن است(I + 40) -th Day و X I + 40 + N مقدار قیمت بسته شدن روز (I + 40 + N) است.
سپس ، ما هدف ما پیشنهاد یک شبکه عصبی ترکیبی برای یادگیری عملکرد F (x) برای پیش بینی روند قیمت یک هفته یا یک ماه بعد است.
3. 2شبکه عصبی ترکیبی بر اساس یادگیری ویژگی های مقیاس زمانی چندگانه
در این بخش ، ما یک مرور کلی از شبکه عصبی ترکیبی پیشنهادی بر اساس یادگیری ویژگی های مقیاس زمانی چندگانه برای پیش بینی روند ارائه می دهیم. سپس ، ما هر مؤلفه شبکه عصبی ترکیبی را شرح می دهیم.
3. 2. 1. بررسی اجمالی
ایده شبکه عصبی ترکیبی پیشنهادی به سه بخش تقسیم می شود. بخش اول استخراج ویژگی های مقیاس های مختلف سری از سری قیمت ها از طریق لایه های مختلف CNN است و آنها را با سری قیمت های روزانه اصلی ترکیب کنید تا تغییرات نسبتاً کوتاه ، میان مدت و بلند مدت در دنباله قیمت را منعکس کند. به ترتیب. بخش دوم استفاده از چندین LSTM برای یادگیری وابستگی های زمانی از ویژگی های مقیاس های مختلف است. قسمت آخر ترکیب تمام اطلاعات آموخته شده توسط LSTMS از طریق یک شبکه عصبی کاملاً متصل برای پیش بینی روند قیمت بسته شدن در آینده است. اگرچه شبکه عصبی ترکیبی از انواع مختلفی از معماری های شبکه تشکیل شده است ، اما می توان آن را با یک عملکرد از دست دادن به طور مشترک آموزش داد. شکل 2 ساختار شبکه عصبی ترکیبی را نشان می دهد ، که می تواند به عنوان ترکیبی از سه مدل بر اساس یادگیری ویژگی های مقیاس زمانی یک بار مشاهده شود. سه مدل در شکل 3 نشان داده شده است. در مرحله بعد ، ما هر قسمت از مدل پیشنهادی را با جزئیات معرفی خواهیم کرد.
3. 2. 2. یادگیری ویژگی در مقیاس زمانی چندگانه
با توجه به اینکه ویژگی های مقیاس زمانی متعددی در توالی شاخص بورس وجود دارد و ترکیب این ویژگی ها می تواند به پیش بینی دقیق تر روند قیمت کمک کند. در این مقاله به بررسی قوانین داخلی حرکت قیمت از سه مقیاس زمانی می پردازیم. از یک طرف، دنباله قیمت روزانه نشان داده شده توسط F 1 را می توان به عنوان دنباله ویژگی حداقل مقیاس زمانی در نظر گرفت. این می تواند منعکس کننده تغییرات قیمت محلی باشد که برای پیش بینی حیاتی است. از سوی دیگر، خروجی لایههای مختلف CNN سری قیمت اصلی را از مقیاسهای زمانی مختلف توصیف میکند. این خروجی ها را می توان به عنوان ویژگی های مقیاس های زمانی مختلف در نظر گرفت. از آنجایی که CNN دارای دو لایه است، میتوانیم ویژگیها را در دو مقیاس زمانی مختلف دریافت کنیم که به صورت F 2 و F 3 نمایش داده میشوند. به این ترتیب، ما سه نوع ویژگی، F 1، F 2 و F 3 را به دست می آوریم که به ترتیب می توانند تغییرات روند نسبتا کوتاه، میان مدت و بلند مدت را منعکس کنند.
3. 2. 3. یادگیری وابستگی ها در ویژگی های مقیاس زمانی چندگانه
ما از سه LSTM برای یادگیری وابستگی های زمانی در ویژگی های مقیاس های زمانی مختلف استفاده می کنیم. ما باید نقشه های ویژگی استخراج شده توسط CNN را به توالی ویژگی های مناسب برای LSTM ها توسط نقشه به لایه توالی تبدیل کنیم. همانطور که در شکل 4 نشان داده شده است، نقشه های ویژگی نشان دهنده ویژگی های آموخته شده توسط CNN است. رنگ های مختلف نشان می دهد که این نقشه های ویژگی توسط هسته های کانولوشن مختلف به دست آمده اند. نقاط در نقشه ویژگی به ترتیب زمانی از چپ به راست مرتب شده اند. دنباله ویژگی ورودی LSTM را نشان می دهد. بردار ویژگی در دنباله ویژگی با f v t نشان داده می شود و زیرنویس t مطابق با ترتیب آن در سری است. هر بردار ویژگی از چپ به راست بر روی نقشه های ویژگی توسط ستون ایجاد می شود. این به این معنی است که بردار ویژگی i بهم پیوسته ستون های i همه نقشه ها است.
هر شبکه LSTM وابستگی های زمانی را در توالی ویژگی های مربوطه خود می آموزد و فرآیند به صورت زیر شرح داده می شود. در LSTM، هر سلول دارای سه دروازه اصلی است: دروازه ورودی، دروازه فراموشی و گیت خروجی. فرض کنید که بردار ویژگی ورودی در زمان t f v t باشد و حالت پنهان در مرحله زمانی قبلی h t − 1 باشد.