توسعه شدید شبکه عصبی سری زمانی در سالهای اخیر امکانات بالقوه بسیاری را برای استفاده از فناوری مالی به ارمغان آورده است. این تحقیق یک مدل پیش بینی روند سهام را ارائه می دهد که ترکیبی از واحد مکرر گیت و مکانیسم توجه است. در چارچوب پیشنهادی ، این مدل قیمت افتتاحیه روزانه ، قیمت بسته شدن ، بالاترین قیمت ، کمترین قیمت و حجم معاملات سهام را به عنوان ورودی می گیرد و از پیش بینی انتقال شاخص فنی به عنوان یک برچسب برای پیش بینی افزایش احتمالی و سقوط احتمالی روزهای معاملاتی آینده استفاده می کند. وادنتایج تحقیق نشان می دهد که مدل پیشنهادی و برچسب های طراحی شده توسط این تحقیق می تواند به طور مؤثر نوسانات مهم قیمت سهام را پیش بینی کند و می تواند به طور مؤثر در استراتژی های تجارت کالاهای مالی اعمال شود.
1. مقدمه
یادگیری ماشین (ML) یکی از شاخه های هوش مصنوعی (AI) است [1]. این امر به طور کلی به روش استنباط و خلاصه کردن داده ها از طریق یک قانون ریاضی خاص از طریق یک برنامه و در نهایت به دست آوردن یک مدل پیش بینی کننده اشاره دارد [2،3]. روشهای یادگیری ماشین را می توان با توجه به اینکه داده ها دارای برچسب هستند یا خیر ، به یادگیری تحت نظارت ، یادگیری بدون نظارت ، یادگیری نیمه تحت نظارت ، یادگیری تقویت و غیره تقسیم شوند. [4،5]. در میان بسیاری از انواع مختلف الگوریتم های یادگیری ماشین ، یادگیری تحت نظارت به دلیل صحت آن در پیش بینی هدف ، در مشکلات مختلف طبقه بندی مورد استفاده قرار می گیرد. الگوریتم های یادگیری تحت نظارت رایج شامل الگوریتم ژنتیکی [6] ، طبقه بندی کننده Bayes [7] ، تجزیه و تحلیل رگرسیون [8] ، دستگاه بردار پشتیبانی (SVM) [9] ، روش مبتنی بر آنتروپی [10] ، یادگیری عمیق (DL) [11] ،و غیره امروزه ، الگوریتم های مختلف یادگیری عمیق و یادگیری ماشین به طور گسترده ای در زمینه های مختلف مانند شبکه های ارتباطی ، کنترل QoS ، ارتباطات 4G/5G ، اینترنت چیزها و پردازش زبان طبیعی مورد استفاده قرار گرفته است [12،13،14،15].
در میان مدلهای مختلف شبکه عصبی ، شبکه عصبی مکرر (RNN) [16] ، حافظه کوتاه مدت طولانی (LSTM) [17] ، واحد مکرر دروازه (GRU) [18] ، مکانیسم توجه [19] و سایر مدل های DNN سری زمانی هستندبه خصوص در پردازش داده های مداوم ، مانند پردازش زبان طبیعی ، ترجمه ماشین ، تشخیص گفتار ، پیش بینی شاخص مالی و غیره خوب است.
رواج دیجیتالی شدن مالی و توسعه شدید هوش مصنوعی نیز روندهای آینده مدیریت مالی موبایل و فناوری جدید مالی (فین تک) را هدایت کرده است. در تحقیقات نظری، نلسون [20] مفهوم استفاده از شبکه های عصبی LSTM را برای پیش بینی روند آینده سهام پیشنهاد کرد. برچسب مدل یک طبقه بندی باینری است: در مقایسه با قیمت بسته شدن روز قبل، قیمت روز فعلی بالا/پایین است. اهداف آزمایشی چهار سهم انتخاب شده از بورس اوراق بهادار برزیل بودند و نتیجه به دقت پیشبینی تا 55. 9 درصد رسید.
چن و همکاران[21] از مدل LSTM برای تخمین روند قیمت نفت خام WTI استفاده کرد. این آزمایش LSTM، شبکه باور عمیق، مدل میانگین متحرک خود رگرسیون (ARMA) و مدل پیادهروی تصادفی را مقایسه کرد و نتایج نشان داد که مدل LSTM نسبت به تغییرات قیمتهای آتی نفت خام حساستر است.
فابر و مورو [22] از مدل RNN-LSTM برای انجام تحلیل رگرسیون و طبقه بندی برای میانگین صنعتی داوجونز (DJIA) استفاده کردند. داده های آموزشی شامل 2000-2017 شاخص داو جونز و زمان پس آزمون شامل 2009-2017 بود. نتایج نشان داد که مدل پیشبینی میکند که روند میتواند به وضوح نزدیک به ماده واقعی باشد.
چن و همکاران[23] یک تقویت RNN همراه با تخصیص دیریکله پنهان (LDA) برای انتخاب ویژگی داده ها پیشنهاد کرد. هدف آزمایشی شاخص سهام شانگهای-شنژن 300 (HS300) است و تابع هدف پیشبینی فراز و نشیبهای شاخص است. نتایج نشان می دهد که مدل سری زمانی بهتر از سایر روش های سنتی مانند رگرسیون بردار پشتیبان (SVR) عمل می کند [24].
لی و همکاران[25] ابتدا مدل MI-LSTM (Multi-Input) را بر اساس مکانیسم توجه پیشنهاد کرد. در مدل پیشنهادی، لایه توجه خروجی لایه LSTM را می پذیرد و در نهایت از Softmax برای به دست آوردن نتایج پیش بینی افزایش و سقوط شاخص استفاده می کند. هدف، شانگهای-شنژن CSI 300 است که 300 سهام برتر با بیشترین وزن در بازارهای سهام شانگهای و شنژن است. نتایج نشان می دهد که مدل توالی با مکانیسم توجه بهتر از مدل توالی عمومی است.
رووی و همکاران.[26] از مدلهای DNN ، LSTM و CNN برای دستیابی به تجزیه و تحلیل پیش بینی معاملات در زمان واقعی قبل از بازی های شرط بندی استفاده کرد. موضوع آزمایشی مبادله شرط بندی Betfair در انگلستان است که بزرگترین معامله گر شرط بندی در انگلستان است. ویژگی های داده شامل موارد زیر است: یکپارچه سازی تغییر قیمت دونده و دونده رقیب ، تغییر نقدینگی در هر دو طرف ASK/BID ، تغییر حجم و جهت. در سطح نظری ، LSTM برای تجزیه و تحلیل و پیش بینی سری زمانی در زمان واقعی مناسب تر است. با این حال ، نتیجه آزمایشی نشان می دهد که CNN قبل از بازی شرط بندی ، دقت بیشتری را در پیش بینی به دست آورد.
فنگ و همکاران.[27] مفهوم جدید نمودار نمودار (TGC) را پیشنهاد کرد. با توجه به ویژگی های توالی سهام N و رابطه باینری چند بعدی ، TGC می تواند ویژگی های دنباله جدیدی را به دست آورد و به دست آورد. این تحقیق LSTM و TGC را برای انجام محاسبه همبستگی و رتبه بندی به سهام وزنی ترکیب می کند و از این همبستگی برای پیش بینی بازده سرمایه گذاری بازار استفاده می کند. تحقیقات آن بازده بسیار بالایی در سرمایه گذاری در پشتی NASDAQ و NYSE به دست آورده است.
لی و همکاران.[28] یک شبکه Q عمیق (DQN) همراه با یک شبکه عصبی حلقوی ارائه داد. این مدل حجم معاملات سهام و نمودارهای بسته بندی قیمت را به عنوان ورودی می گیرد و در مورد داده های کشورهای مختلف آموزش داده می شود. نتایج نشان می دهد که مدل پیشنهادی ویژگی یادگیری انتقال را دارد و می تواند بر روی داده های نسبتاً بزرگ آموزش داده و در یک بازار کوچک آزمایش شود. از نظر بازده سرمایه گذاری و سازگاری مدل ، فنگ و همکاران. و لی و همکاران. مدل های پیشرفته فعلی هستند.
پس از آن ، مدل های شبکه عمیق تر به بازارهای مختلف معاملاتی و پیش بینی قیمت کالاهای مالی اعمال شد [29،30،31،32،33،34]. در تحقیقات قبلی ما [35] ، ما به بررسی اثربخشی و عملی بودن شاخص های فنی مختلف تجزیه و تحلیل مالی در شبکه یادگیری عمیق سری. در این تحقیق از شاخص های فنی متوسط در حال حرکت (MA) شناخته شده برای طراحی الگوریتم انتخاب ویژگی استفاده می کند و از LSTM چهار لایه برای انجام اندازه گیری واقعی استفاده می کند. هدف تجربی Twse 0050 ETF است ، و نتایج تأیید می کند که شاخص های فنی می توانند به طور مؤثر دقت پیش بینی مدل را در شبکه عمیق سری زمانی بهبود بخشند.
بر اساس بحث در مورد ادبیات فوق ، می توان دریافت که بیشتر تحقیقات فعلی در مورد کاربرد شبکه عمیق در محصولات مالی عمدتاً مبتنی بر پیش بینی قیمت است. بیشتر مدل ها از شاخص های فنی مالی استفاده نمی کنند و همچنین روی استراتژی های معاملاتی تمرکز نمی کنند. این مطالعه شاخص های فنی را به شبکه عصبی عمیق معرفی می کند ، و بررسی می کند که آیا خروجی مدل به عنوان یک مرجع استراتژی معاملاتی به طور مستقیم مؤثر است. این تحقیق ترکیب شبکه عصبی ، GRU و مکانیسم توجه را برای طراحی یک مدل استراتژی تجارت سهام مبتنی بر یادگیری عمیق ترکیب می کند و شاخص های فنی را برای تجزیه و تحلیل تجربی ترکیب می کند.
فصل های باقیمانده این مطالعه به شرح زیر است: بخش دوم در مورد مدل های سری زمانی DNN بحث می کند ، بخش سوم چارچوب پیشنهادی را معرفی می کند ، بخش چهارم نتایج و تجزیه و تحلیل تجربی است و بخش پایانی نتیجه گیری و آثار آینده را ارائه می دهد.
2. شبکه های عصبی عمیق سری زمان
در این بخش مفاهیم یادگیری عمیق مورد استفاده در این تحقیق ، از جمله شبکه عصبی عمیق تغذیه ، شبکه عصبی Backpropagation ، شبکه عصبی مکرر (RNN) ، واحد مکرر دروازه (GRU) و مکانیسم توجه معرفی شده است.
2. 1شبکه عصبی عمیق
شبکه عصبی عمیق (DNN) با استفاده از داده های آموزش برای یادگیری و اصلاح وزن بین نورون ها برای دستیابی به خروجی صحیح ، عملکرد هدایت عصب انسان را شبیه سازی می کند. مزیت شبکه عصبی نسبت به سایر الگوریتم های یادگیری ماشین این است که نیازی به فرض همبستگی و رابطه نسبی بین پارامترهای ورودی و خروجی ندارد. خود شبکه می تواند به طور خودکار رابطه عمیق بین برچسب و هر ویژگی را بیاموزد و به توانایی نقشه برداری غیر خطی متکی باشد. عملکرد اساسی DNN از دو بخش تشکیل شده است: (1) محاسبات خوراک به جلو و (2) پیشینه گرادیان ، که به شرح زیر شرح داده شده است:
با توجه به تعصب B از هر لایه ، بردار ورودی لایه قبلی x = [x 1 ، x 2 ،… x i ،…] ، بردار وزن لایه قبلی به نورون هدف w = [w 1 ، w 2 ،… W I ،…] ، عملکرد فعال سازی F (a) ، عملیات Feedforward خروجی را بر اساس ورودی لایه قبلی نورون ها تولید می کند: H (x) = f (b + ∑ i x i w i) = f (b + w t x) ،جایی که w t x محصول داخلی بردار وزن w و بردار ورودی x است. قانون یادگیری شبکه عصبی عمدتاً برای ارائه یک عملکرد خطا در E با نمونه های آموزش N است ، DNN وزن به روز شده را از طریق انتقال شیب مشتق شده توسط قوانین دلتا بدست آورد [36،37،38]:
مدت خطای لایه (L + 1) -th را می توان از وزن لایه قبلی بدست آورد و به روزرسانی وزن و تعصب به شرح زیر محاسبه می شود:
جایی که ∘ نشان دهنده ضرب عناصر عناصر ، f (•) معادله تحول غیرخطی در یک نورون است ، w l + 1 ماتریس وزن را از l-layer به (L + 1) نشان می دهد.
2. 2شبکه عصبی مکرر (RNN)
شبکه عصبی مکرر (RNN) یکی از مدل های شبکه عصبی است. در مقایسه با DNN اساسی ، خروجی محاسبه شده از هر لایه پنهان در DNN فقط می تواند به خروجی لایه بعدی در یک جهت منتقل شود و روابط متقابل زمینه قابل تجزیه و تحلیل نیست. RNN وزن لایه پنهان را به دنباله دفعه بعدی منتقل می کند و می تواند تأثیر داده ها را قبل و بعد از داده های فعلی درک کند. در مقایسه با DNN و شبکه های عصبی Convolutional (CNN) ، RNN برای داده های مرتبط با توالی مانند تولید جمله ، تشخیص گفتار ، ترجمه زبان ، پیش بینی سهام و غیره مناسب است [39،40]. ساختار RNN در شکل 1 نشان داده شده است. در این معماری ، U ، V و W وزن مشترک هستند. یک تحول غیر خطی از U به لایه پنهان وجود خواهد داشت. عملکرد انتقال غیرخطی معمولاً Tanh است و عملکرد خطا از آنتروپی متقاطع استفاده می کند. علاوه بر این ، خروجی چند طبقه از طریق عملکرد SoftMax قبل از V برای خروجی تبدیل می شود.
در معماری RNN ، طول ورودی و خروجی ثابت و هماهنگ نیست. بسته به دسته برنامه ، می توان پسوندهای زیر را نیز وجود داشت:
یک به یک: ورودی/خروجی با طول ثابت. به عنوان مثال ، قیمت سهام روز را وارد کنید و قیمت سهام روز بعد را خروجی کنید.
یکی به بسیاری: ورودی منفرد ، خروجی چندگانه. به عنوان مثال ، قیمت سهام روز را به عنوان ورودی بگیرید و قیمت تخمینی سهام را در چند روز آینده بازده کنید.
چند به یک: چند ورودی، تک خروجی. به عنوان مثال، قیمت سهام را در یک هفته وارد کنید، و قیمت سهام هفته آینده را تولید کنید.
همگام سازی چند به چند: هم ورودی و هم خروجی چندتایی هستند. به عنوان مثال، قیمت سهام یک هفته را وارد کنید و به طور همزمان قیمت سهام هفته بعد را در زمان واقعی تولید کنید.
ناهمزمان از بسیاری به بسیاری: قیمت سهام یک هفته را وارد کنید، پس از پایان ورودی، قیمت سهام هفته بعد را به صورت ناهمزمان تولید کنید.
دنباله به دنباله ناهمزمان (Seq2Seq): این نوع ورودی و خروجی داده های دنباله ای هستند و قبل از تولید خروجی، پیام ورودی و کد در مجموعه ای از بردارهای زمینه کدگذاری می شوند و خروجی برای رمزگشایی بردار ویژگی است.. مدل Seq2Seq می تواند وابستگی متن ورودی را با دقت بیشتری بدست آورد.
2. 3. واحد بازگشتی دردار (GRU)
GRU اساساً یک شبکه عصبی بازگشتی است. تفاوت اصلی بین GRU و RNN اساسی این است که حافظه RNN با افزایش توالی داده ها کاهش می یابد. از نقطه نظر تئوری، بازخورد گرادیان لایه پنهان با افزایش داده های توالی لایه به لایه کاهش می یابد. GRU می تواند به طور موثر این مشکل را بهبود بخشد. سلول GRU ساختار نورون ها در یک شبکه عصبی بازگشتی است، همانطور که در شکل 2 نشان داده شده است. GRU جایگزین دروازه فراموشی و دروازه ورودی در LSTM با دروازه به روز رسانی می شود، و محاسبه میانی سلول به شرح زیر است:
در میان آنها، σ تابع سیگموئید، t a n h (⋅) تابع مماس هذلولی است، ∘ نشان دهنده محصول مبتنی بر عنصر (همچنین به عنوان محصول هادامارد شناخته می شود)، و b سوگیری سلولی است. در زمان t، حالت h t − 1 و ورودی x t زمان قبلی t − 1 وارد می شود و دو گیت: Reset Gate r t و Update Gate z t از طریق σ به دست می آیند. در نهایت، محصول عنصر و tanh در یک حالت جدید h ^ t از 1- تا 1 ادغام می شوند، که می تواند به طور همزمان حالت را فراموش کرده و به خاطر بسپارد. آخرین حافظه به روز رسانی h ^ t و h t - 1 را به نقطه زمانی بعدی ادغام می کند. در مقایسه با عملیات LSTM، GRU کنترل دروازه کمتری دارد و می تواند عملکرد بالاتری را بایگانی کند.
2. 4. مکانیسم توجه
مکانیسم توجه اولین بار در زمینه بینایی کامپیوتری ارائه شد. تیم Google Mind مکانیسم توجه را در مدل RNN برای طبقهبندی تصویر اعمال کرد و به دقت بسیار بالایی دست یافت [41]. متعاقباً، Bahdanau و Bengio، برندگان جایزه تورینگ 2018، مکانیسم توجه را برای کارهای ترجمه ماشینی همزمان اعمال کردند و به عملکرد بسیار بالایی دست یافتند [42].
مدل مبتنی بر توجه در اصل یک اندازه گیری شباهت است. هرچه ورودی جریان و حالت هدف مشابه تر باشد ، وزن ورودی جریان بیشتر می شود ، نشان می دهد که خروجی جریان بیشتر به ورودی جریان وابسته است. از نظر فنی ، مکانیسم توجه یک نسخه بهبود یافته از مدل توالی به توالی (SEQ2SEQ) در RNN است. در مرحله رمزگذاری سری زمانی سنتی RNN ، حالت پنهان هر زمان به جلو منتقل می شود و مجموعه ای از بردارهای ابعاد یکنواخت قبل از رمزگشایی تولید می شود. این رویکرد در هر داده آموزشی مطابق با همان مجموعه بردار زمینه نتیجه می گیرد. مکانیسم توجه (نشان داده شده در شکل 3) با هدف بهبود این وضعیت است. این کشور هر حالت پنهان را به رمزگشایی پشتی منتقل می کند و باعث می شود وضعیت مهم در دوره زمانی توسط شبکه آموخته شود ، یعنی تمرکز توجه.
3. معماری پیشنهادی GRU و شاخص های فنی عادی سازی
3. 1مدل پیش بینی توجه GRU پیشنهادی
در این بخش مدل پیش بینی توجه GRU ارائه شده است. معماری سیستم این تحقیق در شکل 4 نشان داده شده است. ورودی مدل مجموعه ای از تانسرهای سه بعدی سری زمانی است: ابعاد نشان دهنده داده های معاملات روزانه (افتتاح ، بسته شدن ، بالاترین ، کمترین و حجم معاملات) ، طول توالی زمان واندازه دستهمعماری را می توان به عنوان یک تابع هدف P (y 1 ،… ، y t ′ | x 1 ،… ، x t) = ∏ t = 1 t ′ p (y t | c ، y 1 ،… ، y t - 1) در نظر گرفت.، جایی که x 1 ،… ، x t تنش های ورودی ، y 1 ،… ، y t ′ برچسب ها هستند ، c نمایانگر بردار زمینه است. لایه پنهان حاوی ساختار GRU از 128 نورون است. پس از خروج به لایه توجه ، بردار رمزگشایی تولید می شود و در نهایت احتمال دسته هدف توسط لایه کاملاً متصل و عملکرد SoftMax خروجی می شود.
همانطور که در شکل 3 نشان داده شده است ، طول توالی و اندازه دسته پارامترهای قابل تنظیم است و StockVec ویژگی های معاملاتی روزانه سهام ورودی است. رمزگذار مدل معماری GRU-RNN است. GRU ورودی را دریافت می کند و محاسبات فرمولها (6) - (9) را اجرا می کند ، و سپس برای محاسبه بردار متن هر زمان ، وارد لایه توجه می شود. این تحقیق توجه سبک Luong را پذیرفته است [43] ؛عملیات دقیق به شرح زیر است:
وزن توجه α T S: از حالت پنهان از رمزگذار فعلی استفاده کنید تا یک عملیات نمره را در حالت های پنهان کل رمزگذار انجام دهید تا اهمیت H T را به هر H ˜ S از طریق عملکرد SoftMax بدست آورید.
وکتور توجه A T: جمع بندی بردار زمینه و رمزگشایی حالت پنهان و انجام تحول غیرخطی.
پس از تولید وکتور رمزگذاری از طریق GRU ، ویژگی های نهفته از طریق مجموعه ای از لایه های کاملاً متصل حفظ می شوند و احتمال کلاس از طریق SoftMax [44] خروجی می شود ، که احتمال کلاس J-TH را از وکتور ورودی X پیش بینی می کند:
3. 2شاخص های فنی عادی سازی
شاخص های فنی (TI) داده های شاخص استفاده شده توسط سرمایه گذاران برای اجرای تحلیل فنی (TA) هستند. TA می تواند اطلاعات بازار ، مانند شدت معاملات سرمایه گذار ، روندهای کوتاه مدت ، هزینه معاملات و غیره را ساده کند و آن را در مورد ارزش یا نمودار منعکس کند تا به سرمایه گذاران کمک کند تا تصمیم بگیرند. این مطالعه شاخص قدرت نسبی (RSI) [45] و نسبت تعصب (BIAS) [46] را اتخاذ می کند ، که رایج ترین ابزارهای TA استفاده شده توسط تحلیلگران و شرکتهای اوراق بهادار است ، زیرا برچسب های تخمینی سیگنال بورس سهام برای پیش بینی UPS ممکن استو فراز و نشیب روزهای معاملاتی آینده.
3. 2. 1. شاخص قدرت نسبی (RSI)
The Relative Strength Index (RSI) is a kind of momentum indicator in the stock market. RSI uses the strength of both buyers and sellers as a technical indicator for evaluation, this indicator can be used to analyze the ratio of strengths between buyers and sellers in a certain period of time. The value of RSI ranges from 0 to 100. If RSI >70-80 ، معمولاً به این معنی است که بازار بیش از حد گرم می شود و ممکن است قیمت سهام کاهش یابد. RSI< 20–30 means that market transactions have steadily converged and may rebound. This study uses this as the basis for the ups and downs categories, and predicts possible stock price rebounds or turning points in the future trading days. The RSI calculation method is as follows:
در مقایسه با افزایش روز گذشته ، قیمت سهام روی U تعیین شده است و پاییز روی D تعیین شده است. E M A (u ، n) به میانگین افزایش روزهای n اشاره دارد و E M A (D ، N) متوسط کاهش در روزهای N است. این مطالعه به عنوان برچسب های سه طبقه ، 20-30 ≤ 70-80 ≤ 80 ≤ 70-80 طول می کشد و جزئیات در این آزمایش مورد بحث قرار خواهد گرفت.
3. 2. 2. نسبت تعصب (تعصب)
BIAS از میانگین متحرک به عنوان معیار استفاده می کند و آن را با قیمت داخلی یا قیمت بسته شدن روز مقایسه می کند تا ارزش انحراف قیمت سهام را از میانگین بدست آورد. نرخ انحراف را می توان به دو دسته تقسیم کرد."انحراف مثبت" به این معنی است که قیمت سهام بالاتر از میانگین متحرک است و "انحراف منفی" به این معنی است که قیمت سهام زیر میانگین متحرک است. مفهوم تعصب این است که وقتی قیمت سهام به شدت افزایش می یابد و شکاف بین میانگین های متحرک گسترش می یابد ، این بدان معنی است که سرمایه گذاران سود زیادی کسب کرده اند و قیمت سهام در هر زمان به دلیل ظهور فشار فروش بازنگری می شود. وادهنگامی که قیمت سهام به شدت کاهش می یابد و شکاف بین میانگین های متحرک گسترش می یابد ، این بدان معنی است که سرمایه گذاران متحمل خسارات سنگینی شده اند. پس از افت قیمت سهام ، خریداران را برای ورود به بازار جذب می کند. بنابراین ، بازار به زودی دوباره برمی گردد. تعصب معمولاً بین 3 ٪ و 3 ٪ است. اگر بیش از محدوده تنظیم باشد ، ممکن است قیمت سهام معکوس شود. بنابراین ، این مطالعه همچنین از همان معیار برای طراحی سه برچسب از بالا ، پایین و مسطح استفاده می کند. محاسبه تعصب به شرح زیر است:
Bias n نرخ انحراف در روزهای n است ، نزدیک قیمت بسته شدن روز است ، m a n میانگین متحرک قیمت بسته شدن در روزهای n است. در این مطالعه ، N به 6 ، 12 ، 20 تنظیم شده است و جزئیات در این آزمایش مورد بحث قرار خواهد گرفت.
3. 3تجزیه و تحلیل پیچیدگی مدل
در این بخش پیچیدگی مدل ارائه شده در این مطالعه ارائه شده است. در تجزیه و تحلیل پیچیدگی مدل شبکه عمیق ، مرحله آموزش و مرحله آزمایش به طور جداگانه مورد بحث قرار خواهد گرفت. در مرحله آموزش ، اجازه دهید طول توالی ورودی = S ، ابعاد حالت پنهان = Dh، ابعاد ورودی = DI، پیچیدگی زمان برای یک مرحله شیب در GRU O (SD استh2 + SDhDI) طبق [47] و معادلات (1) - (9). لایه توجه بردار ورودی D را مستقیماً از لایه GRU می گیرد. بنابراین ، پیچیدگی لایه توجه O (S 2 D) است. پیچیدگی کل مدل پیشنهادی O خواهد بود (SDh2 + SDhDI+ S 2 D) با توجه به طول دنباله انتخاب شده ، ابعاد حالت پنهان و ابعاد ویژگی ورودی. در مرحله آزمایش ، از آنجا که تغذیه شبکه عصبی یک عمل خطی است ، پیچیدگی زمان O (1) است.
4- نتایج و تجزیه و تحلیل آزمایشی
4. 1تنظیمات محیط آزمایشی
محیط آزمایشی این تحقیق از میزبان ASUS ESC8000 G3 ، پردازنده Xeon E5-2600 V3 ، حافظه 4 گیگابایتی ، Nvidia Geforce GTX 1080 Ti × 8 GPU با Ubuntu 18. 04 LTS OS استفاده می کند. هدف تحقیق شرکت تولید نیمه هادی تایوان ، آموزشی ویبولیتین (TSMC ، کد TPE: 2330) است و دامنه آزمایشی از 4 ژانویه 2016 تا 11 مه 2021 با کل 1300 روز معاملاتی انتخاب شده است و منبع داده گرفته شده استاز اطلاعات عمومی بورس اوراق بهادار تایوان (TWSE). با توجه به اینکه ویژگی معاملات سهام مورد استفاده در این مطالعه در روزها است ، کل روزهای معاملاتی زیاد نیست. برای جلوگیری از کمبود احتمالی ، نسبت داده های آموزشی در تنظیمات آزمایشی افزایش می یابد. در این مطالعه ، 70 ٪ از داده ها به عنوان مجموعه آموزش ، 20 ٪ به عنوان مجموعه اعتبار سنجی و 10 ٪ به عنوان مجموعه آزمون تنظیم شده است. این مدل برای دوره های 50-200 آموزش داده می شود ، اندازه دسته ای به طور یکنواخت روی 32 تنظیم می شود و در نهایت وزن با بالاترین دقت اعتبار سنجی به عنوان مدل پیش بینی استفاده می شود. اقدامات مورد استفاده در این مطالعه فراخوان ، دقت ، F1 و دقت است:
جایی که TP ، TN ، FP و FN به ترتیب مثبت ، منفی واقعی ، مثبت کاذب و منفی را نشان می دهند. اندازه گیری F1 میانگین هارمونیک فراخوان و دقت است. در ارائه نتایج تجربی ، فراخوان می تواند نسبت مقولات واقعی را که با موفقیت پیش بینی شده اند نشان دهد ، و دقت نسبت پیش بینی های موفق را در نتایج پیش بینی نشان می دهد. دقت می تواند ارزیابی کلی از نتایج پیش بینی صحیح و نادرست را انجام دهد. علاوه بر این ، برای کشف علل بالقوه پیش بینی های نادرست در پیش بینی های چند طبقه ، ارائه حاصل شامل ماتریس های سردرگمی برای به وضوح کلاس های نادرست است. عملکرد از دست دادن از آنتروپی متقاطع طبقه بندی شده ، که به شرح زیر تعریف شده است:
4. 2نتیجه تجربی شاخص قدرت نسبی
در این آزمایش ، طبق فرمول (15) و (16) ، سه برچسب شاهزاده در حال افزایش (بالا) ، شاهزاده در حال سقوط (پایین) و مسطح (مسطح) به ترتیب برای 20-80 RSI و 30-70 RSI تنظیم شده است. نتایج تجربی در شکل 5 و شکل 6 و جدول 1 نشان داده شده است. شکل 5A 100 دوره در مقابل از دست دادن مدل را نشان می دهد ، در حالی که شکل 5b داده های دقت آموزش را در 100 دوره نشان می دهد. جدول 1 و شکل 6 فراخوان ، دقت ، F1 ، میانگین دقت و سردرگمی سه دسته را در مجموعه آزمون نشان می دهد. در طی فرایند آموزش ، از دست دادن داده های آموزش به طور پیوسته کاهش می یابد ، اما از دست دادن داده های تأیید در حدود 10-20 دوره همگرا می شود و هنگامی که از 80 دوره فراتر رود ، افزایش می یابد ، نشان می دهد که بسیاری از دوره های آموزشی ممکن است باعث افزایش بیش از حد مدل شوند. نتیجه در شکل 6a نشان می دهد که در 20_80_RSI ، بیشتر دسته "مسطح" را می توان به درستی پیش بینی کرد ، اما بخش خاصی از دسته های "بالا" و "پایین" به عنوان "مسطح" اشتباه می شوند. این به وضوح از نتیجه آزمایشی در شکل 6b مشاهده می شود که در مقایسه با 20_80_RSI ، 30_70_RSI نسبت کمی پایین تر از مثبت کاذب برای دسته های "بالا" و "پایین" دارد. نتایج تجربی نشان می دهد که دقت تخمین زده شده از 20-80 RSI در سه دسته 79. 2 ٪ است که بالاتر از 76. 4 ٪ از 30-70 RSI است. در داده های فراخوان ، دقت و اندازه گیری F1 ، 20-80 RSI نیز کمی بهتر از 30-70 RSI است. در میان آنها ، دقت و یادآوری در گروه "تخت" به 91. 3 ٪ و 83. 2 ٪ می رسد. در سه دسته از پیش بینی ها ، پیش بینی "مسطح" بهترین عملکرد را دارد ، و پیش بینی "بالا" و "پایین" در چند مورد پدیده سوء استفاده از یکدیگر را دارد. علاوه بر این ، فراخوان مدل پیشنهادی بین 64. 2 ٪ و 83. 2 ٪ و میانگین 71. 66 ٪ است ، به این معنی که می توان بیش از 70 ٪ سیگنال های چرخش را به درستی تخمین زد.
4. 3نتیجه تجربی نسبت تعصب
در این آزمایش ، سه برچسب شاهزاده در حال افزایش (بالا) ، شاهزاده در حال سقوط (پایین) و مسطح (مسطح) برای 6 ، 12 و 20 تعصب مطابق فرمول (17) تنظیم شده است. نتایج تجربی در شکل 7 و شکل 8 و جدول 2 نشان داده شده است. شکل 7A تغییر از دست دادن مدل در 100 دوره را نشان می دهد. شکل 7b تنوع دقت را در 100 دوره نشان می دهد. جدول 2 فراخوان ، دقت ، اندازه گیری F1 و میانگین دقت تعصب 6 ، 12 و 20 را نشان می دهد. شکل 8 a-c به ترتیب ماتریس سردرگمی تعصب 6 ، 12 و 20 را نشان می دهد. در این آزمایش ، از دست دادن داده های آموزش به سرعت در 10 دوره کاهش یافت و سپس روند نزولی پایدار را نشان داد. از دست دادن داده های اعتبار سنجی در حدود 10-20 دوره همگرا شد. در شکل 8 a-c ، 6 تعصب دقت پیش بینی بالاتری از 12 تعصب و 20 تعصب دارد. با این حال ، مشابه RSI ، بیشتر اشتباهات "UP" و "Down" به عنوان "مسطح" اشتباه می شوند. دلیل این امر احتمالاً این است که "مسطح" رایج ترین مورد در تجارت بورس است و حجم داده های آن نیز بیشتر از جمع دسته های "UP" و "پایین" است. به طور خلاصه ، دقت پیش بینی 6 روز تعصب 75. 6 ٪ است که کمی بیشتر از تعصب بر اساس 12 روز و تا حد زیادی بهتر از 20 روز تعصب است. میانگین فراخوان و دقت 6 تعصب در سه دسته بالاتر از 12 تعصب و 20 تعصب است. بیست روز تقریباً معادل معاملات یک ماه است. با توجه به سازگاری شبکه عمیق ، نتایج نشان می دهد که آمار تعصب بلند مدت دقت پیش بینی ها را افزایش نمی دهد. مشابه RSI ، برآوردهای Bias بیشتر برای برچسب "مسطح" صحیح است ، با دقت و فراخوان به 87. 2 ٪ و 81. 4 ٪ و در اندازه گیری F1 84. 2 ٪.
4. 4نتایج تجربی استفاده از پشت پرده استراتژی های معاملاتی
بر اساس آزمایشهای فوق، میتوان دریافت که عملکرد پیشبینی مدل پیشنهادی برای شاخصهای فنی RSI کمی بالاتر از BIAS است. با این حال، تعداد مشخصی از برچسبها که در حال افزایش یا کاهش هستند، اشتباه ارزیابی میشوند که مسطح هستند. از دیدگاه مدل طبقه بندی شبکه عمیق، دسته پیش بینی توسط خروجی Softmax محدود می شود. بنابراین، مدل GRU-Attention پیشنهادی متعاقباً خروجی احتمال Softmax را به عنوان مرجعی برای استراتژیهای معاملاتی سرمایهگذاران استخراج میکند. در این مطالعه، نوسانات قیمت سهام TSMC بین 20 آوریل 2020 و 5 مه 2021 بر اساس پارامترهای با دقت بالاتر در آزمایشهای فوقالذکر مورد آزمایش مجدد قرار گرفت و مقدار احتمال افزایشی را بیشتر از یک آستانه معین به عنوان نقطه خرید تخمینی تعیین کرد. نتایج در شکل 9، شکل 10، شکل 11، شکل 12، شکل 13، شکل 14 و شکل 15 نشان داده شده است.
شکل 9 نتایج آزمایش را نشان می دهد که در آن احتمال چرخش RSI به سمت بالا بین 30٪ تا 40٪ است و محدوده معاملات بین 20 آوریل 2020 تا 30 دسامبر 2020 است. این مدل در مجموع 11 پیشنهاد برای نقاط ورود به بازار سهام دارد. در فاصله زمانیشکل 10 نتایج تاریخ معامله 1 ژانویه 2021 تا 11 مه 2021 را نشان می دهد و تنها یک پیش بینی با احتمال افزایش در 30-40٪ وجود دارد. نوسانات سهام از مارس تا می 2021 کاهش می یابد و این مدل همچنین پیش بینی های معقولی را ارائه می دهد. نوسانات بین آوریل 2020 و ژانویه 2021 نسبتاً زیاد است و مدل پیشنهادی نیز ارزش تخمین های ورود به بازار نسبتاً مثبت تری را ارائه می دهد. شکل 11 نتایج آزمایش را نشان می دهد که در آن احتمال چرخش RSI به سمت بالا بیشتر از 40٪ است و دامنه معاملات بین 20 آوریل 2020 و 30 دسامبر 2020 است. در این دوره زمانی، مدل GRU-Attention در مجموع هشت مورد را پیشنهاد کرد. نقاط ورود. در مقایسه با آزمایش قبلی، استفاده از احتمال افزایش 40 درصدی به عنوان نقطه زمانی معامله میتواند به طور مؤثرتری از بازگشت سرمایه مثبت اطمینان حاصل کند. علاوه بر این، در آزمایش برچسب RSI، بیش از 40 درصد احتمال افزایش در بازه زمانی 1 ژانویه 2021 تا 11 مه 2021 وجود ندارد.
شکل 12 و شکل 13 نتایج آزمایش را نشان می دهد که در آن احتمال چرخش BIAS به سمت بالا بین 30٪ و 40٪ با فواصل معاملاتی 20 آوریل 2020 تا 30 دسامبر 2020 و 1 ژانویه 2021 تا 11 مه 2021 است. در کل بازه آزمایشی، مدل GRU-Attention پیشنهادی در مجموع 11 فرصت ورود به بازار را ایجاد کرد. در نتایج این آزمایش، اکثر نقاط ورودی نقاط نسبتاً پایینی در کل باند سهام هستند. شکل 14 و شکل 15 نتایج آزمایش را نشان می دهد که در آن احتمال چرخش BIAS به سمت بالا بیشتر از 40٪ است، به ترتیب با فواصل معاملاتی 20 آوریل 2020 تا 30 دسامبر 2020 و 1 ژانویه 2021 تا 11 مه 2021. در این بازه زمانی، 13 نتیجه پیشبینی با احتمال افزایش تخمینی بیش از 40 درصد وجود دارد. نتایج پیشبینیشده در بازه زمانی 20 آوریل 2020 تا 30 دسامبر 2020 میتواند بازده سرمایهگذاری مثبت را به دست آورد، و تعداد کمی از نتایج پیشبینیشده از 1 ژانویه 2021 تا 11 مه 2021 در مدت زمان کوتاهی بازده مثبتی کسب نکردهاند.
بر اساس نتایج تجربی فوق، می توان دریافت که استفاده از RSI و BIAS به عنوان برچسب برای آموزش مدل می تواند به دقت متوسط بیش از 70 درصد در طبقه بندی دست یابد. میانگین دقت پیشبینی با RSI بالاتر از BIAS است. با این حال، در وارد کردن مدل به استراتژی معاملات، نتایج نشان میدهد که نقطه زمانی تخمین BIAS نسبتاً پایدار است. در نتیجه افزایش تخمینی قیمت سهام، کاهش کوتاه مدت کمتری وجود دارد.
4. 5. نتایج تجربی در مقایسه با مدلهای پیشرفته و روشهای سنتی
در این بخش، مدل پیشنهادی در این تحقیق را با روشهای دیگر از جمله مدلهای پیشرفته مقایسه میکنیم [27،28]. سایر مدلهای رایج یادگیری ماشین، از جمله الگوریتم k-نزدیکترین همسایه (KNN)، SVM و Random Forest [48] نیز گنجانده شدهاند. روش های یادگیری ماشین فوق معمولاً در مسائل طبقه بندی داده های عددی استفاده می شوند. این مطالعه این مدلها را برای بررسی اثربخشی آنها برای مسائل طبقهبندی سریهای زمانی ترکیب میکند. کد منبع [27،28] در مقالات اصلی ارائه شده است، رویکردهای دیگر توسط این تحقیق پیاده سازی شده است. در محیط آزمایشی [27]، ما 20 سهام الکترونیکی در بورس اوراق بهادار تایوان را به عنوان سهام مرتبط با هدف TPE:2330 انتخاب کردیم. نرخ بازده مثبت تخمین زده می شود که قیمت آن افزایش یابد و بالعکس. در محیط آزمایشی [28]، ما از ماژول CNN با نمودار حجم قیمت برای آموزش استفاده کردیم. نتایج تجربی در جدول 3 نشان داده شده است.
از جدول 3 می توان دریافت که معماری GRU_ATT با شاخص های فنی ارائه شده توسط این تحقیق، بهبود قابل توجهی در عملکرد کلی نسبت به سایر الگوریتم ها دارد. رویکرد عادی سازی BIAS نسبت به [27،28] در اندازه گیری دقت 7. 62% و 11. 38% بهبود یافته است و رویکرد RSI به ترتیب 4. 02% و 7. 78% بهبود یافته است. در میان سایر روشهای یادگیری ماشین، KNN عملکرد بهتری دارد و دقت پیشبینی نزدیک به ۷۰ درصد دارد در حالی که Random Forest به ۶۰ درصد نمیرسد. در الگوریتمهای مقایسه شده در این مطالعه، بیشتر مدلها دقت و یادآوری پایینی برای افزایش و کاهش قیمت دارند که نشاندهنده حساسیت کمتر این مدلها به دادههای سری زمانی است.
4. 6. نتایج تجربی اعمال بر 10 سهم وزن دار برتر در TWSE
برای تأیید اثربخشی و مقیاس پذیری چارچوب پیشنهادی ، ما مدل پیشنهادی را دوباره آموزش داده و دقت را برای 10 سهام برتر وزنی TWSE محاسبه می کنیم: شرکت تولید نیمه هادی تایوان ، آموزشی ویبولیتین (TPE: 2330) ، شرکت MediaTek (TPE: 2454) ،شرکت Hon Hai Precision Industry Co. ، Ltd. (TPE: 2317) ، شرکت Petrochemical Formosa (TPE: 6505) ، Chunghwa Telecom (TPE: 2412) ، شرکت هلدینگ مالی Fubon ، Ltd. (TPE: 2881) ، Cathay Financial Holding Co Holding Financial. ، آموزشی ویبولیتین (TPE: 2882) ، شرکت میکروالکترونیک متحد (TPE: 2303) ، شرکت دریایی Evergreen (TPE: 2603) و Delta Electronics ، Inc. (TPE: 2308). به جز TPE: 2330 ، مدل های دیگر با ویژگی های حجم و قیمت اساسی برای مقایسه تفاوت ها با و بدون شاخص های فنی آموزش داده شدند. نتایج در جدول 4 نشان داده شده است. نتایج تجربی نشان می دهد که دقت مدل حتی بدون استفاده از شاخص های فنی هنوز هم می تواند به تقریباً 70 ٪ برسد. در بین تمام نتایج پیش بینی ، فراخوان/دقت با پیش بینی مسطح بالاترین است و تفاوت های فردی در دسته های دیگر وجود دارد.
5. نتیجه گیری و آثار آینده
این تحقیق یک شبکه عصبی عمیق GRU را به عنوان یک مرجع استراتژیک برای تجارت سهام پیشنهاد می کند. با کمک نظری شاخص های فنی ، اثربخشی شبکه عمیق برای پیش بینی روند کالاهای مالی محدود به صحت پیش بینی نمی شود و احتمال دسته پیش بینی می تواند به طور مستقیم در طراحی استراتژی های معاملات بازار سهام اعمال شود. هدف آزمایشی شرکت تولید نیمه هادی تایوان ، آموزشی ویبولیتین (TSMC ، TPE: 2330) است که در حال حاضر بزرگترین تولید کننده نیمه هادی در جهان است. این مدل از داده های قیمت سهام 4 ژانویه 2016-11 مه 2021 برای آموزش و آزمایش و قیمت 20 آوریل 2020-11 مه 2021 برای استراتژی معاملات پس زمینه استفاده می کند. سهم اصلی این مطالعه به شرح زیر خلاصه شده است:
ابزارهای معروف تجزیه و تحلیل کالاهای مالی مانند شاخص قدرت نسبی و نسبت تعصب می توانند به طور مؤثر به دقت پیش بینی شبکه های عصبی سری زمانی کمک کنند.
با استفاده از TPE: 2330 به عنوان نمونه ، مدل پیشنهادی GRU می تواند به طور متوسط پیش بینی بیش از 70 ٪ را بدست آورد.
با کمک RSI و تعصب TIS ، نقاط افزایش پیش بینی شده توسط مدل می تواند در بیشتر موارد پرداخت مثبت شود.
در مقایسه با سایر مدل های شبکه عمیق و شبکه های غیر عمق ، رویکرد پیشنهادی بهبود قابل توجهی عملکرد در دقت پیش بینی دارد.
محدودیت نتیجه گیری این مطالعه در استفاده از شاخص های فنی RSI و تعصب است که در مدل توجه GRU + ترکیب شده اند. در صورت استفاده از سایر شاخص های فنی ، روش عادی سازی شاخص باید دوباره طراحی و آموزش داده شود. آثار آینده این تحقیق شامل موارد زیر است:
مفاهیم ارائه شده در این مطالعه را به سایر شبکه های غیر دنباله مانند CNN ، ترانسفورماتور و غیره گسترش دهید.
مدل پیشنهادی را در انواع دیگر محصولات مالی مانند آینده ، گزینه ها ، معاملات روز و غیره اعمال کنید.
استراتژی های معاملات عمیق یادگیری را به سبد سرمایه گذاری محصولات مختلف مالی گسترش دهید.
تحقیقات آینده در مورد استفاده از شبکه های عمیق برای استراتژی های معاملاتی می تواند به اوراق بهادار سرمایه گذاری گسترش یابد.
Cryptocurrency یک کالای محبوب در بازار سرمایه گذاری فعلی است و این تحقیق را می توان به تجزیه و تحلیل روند رمزنگاری گسترش داد.
منابع مالی
این مقاله توسط وزارت علوم و فناوری (بیشتر) تحت اکثر 110-2221-E-130-008 پشتیبانی می شود.
صورت در دسترس بودن داده ها
تصدیق
نویسنده مایل است از وزارت علوم و فناوری (بیشتر) برای حمایت از آنها در این مطالعه تشکر کند.