دانیل لیبمن * ، سیمی هابر و مری شپس
- گروه ریاضیات ، دانشگاه بار-ایلان ، رامات گان ، اسرائیل
نقدینگی نقش مهمی در بازارهای مالی دارد و بر تعداد بیشماری از عوامل از جمله قیمت سهام ، بازده و ریسک تأثیر می گذارد. در بورس سهام ، نقدینگی معمولاً از طریق کتاب سفارش اندازه گیری می شود که سفارشات تعیین شده توسط معامله گران را برای خرید و فروش سهام در نقاط مختلف قیمت ضبط می کند. معرفی سیستم های تجاری الکترونیکی در سالهای اخیر باعث شده است که لایه های عمیق تر کتاب سفارش برای معامله گران قابل دسترسی تر و در نتیجه مورد علاقه بیشتر محققان باشد. در این مقاله به بررسی اثربخشی استفاده از لایه های عمیق تر کتاب سفارش در هنگام پیش بینی عمق نقل شده-اندازه گیری نقدینگی-در هر دقیقه می پردازیم. با استفاده از شبکه های عصبی به جلو ، ما نشان می دهیم که لایه های عمیق تر اطلاعات اضافی را در مقایسه با لایه های فوقانی به تنهایی ارائه می دهند.
1. مقدمه
مطالعات بیشمار نقش حیاتی نقدینگی در بازارهای مالی را تأیید می کند. همانطور که در زیر شرح داده شده است ، نقدینگی بر ثبات بازار و فعالیت تجارت تأثیر می گذارد. این کار در بی شمار سازوکارها انجام می شود. به عنوان مثال ، فقدان نقدینگی به نوسانات قیمت سهام و بازده کمک می کند. علاوه بر این ، نقدینگی اغلب توسط معامله گران حرفه ای برای مدیریت ریسک استفاده می شود.
در بورس سهام ، فعالیت معاملاتی از طریق کتاب سفارش محدود مدیریت می شود ، که نشان دهنده مجموعه ای از سفارشات خرید و فروش است که توسط معامله گران در انواع مختلف قیمت قرار دارد. بهترین پیشنهاد و بهترین قیمت ها نشان دهنده قیمت فعلی بازار است که در آن انتظار می رود یک سفارش قرار داده شده بلافاصله یا در مدت زمان کوتاهی اجرا شود. از آنجا که معامله گران سفارشات را در نقاط مختلف قیمت قرار می دهند ، بهترین پیشنهاد و بهترین قیمت ها اغلب در طول روز معاملات نوسان می یابد. به عنوان مثال ، هجوم سفارشات فروش در بازار به سرعت حجم موجود را با بهترین قیمت پیشنهاد می کند و از این طریق لایه پیشنهادی بعدی را در معرض دید قرار می دهد ، که به بهترین لایه پیشنهاد تبدیل می شود. این قیمت سهام را پایین می آورد. بنابراین ، لایه های عمیق تر کتاب سفارش دائماً در طول روز تجارت در معرض دید قرار می گیرد.
نقدینگی اغلب از طریق بهترین قیمتها و حجمهای پیشنهادی و بهترین قیمتها اندازهگیری میشود که بالاترین لایههای کتاب سفارش محدود را نشان میدهند. در نتیجه، از نظر تاریخی، بسیاری از تحقیقات صرفاً بر روی این لایههای بالایی متمرکز شدهاند، که اساساً لایههای عمیقتر در کتاب سفارش را نادیده میگیرند. با این حال، معرفی سیستمهای معاملات الکترونیکی در سالهای اخیر، بررسی و مطالعه لایههای عمیقتر را بهطور قابلتوجهی کاربردیتر و در نتیجه مورد توجه بیشتری قرار داده است، بهویژه که مطالعات متعدد نشان میدهند که لایههای عمیقتر حاوی اطلاعات ارزشمندی درباره نقدینگی هستند. علاوه بر این، ظاهراً هیچ تحقیقی در مورد پیشبینی عمق نقلشده انجام نشده است - یک معیار پذیرفتهشده نقدینگی که از بهترین حجم پیشنهادی و بهترین حجم درخواست تشکیل شده است - بر اساس هر دقیقهلایه های موجود در دفترچه سفارش در رابطه با این اقدام.
در این مقاله، کارآمدی استفاده از لایههای عمیقتر و بهطور سنتی پنهان کتاب سفارش را در پیشبینی عمق نقلقولشده بر اساس هر دقیقه بررسی کردیم. ما برای الگوریتم پیشبینی خود از شبکههای عصبی پیشخور عمیق استفاده میکنیم. محبوبیت یادگیری عمیق به طور پیوسته در حال افزایش است، به ویژه در مطالعات آکادمیک، که کاربردهای موفقیت آمیزی از الگوریتم های یادگیری عمیق را در تنظیمات مختلف نشان داده است (به عنوان مثال، Libman و همکاران، 2019 را ببینید). با وجود این، مقالاتی که در مورد کاربرد روش های یادگیری عمیق در بازارهای مالی تحقیق می کنند، اغلب اخیراً و تعداد کمی هستند.
نتایج ما نشان میدهد که لایههای عمیقتر دفتر سفارش اطلاعات مفیدی را در پیشبینی عمق نقلقولشده بر اساس هر دقیقه ارائه میکند، بهویژه زمانی که به تنهایی با بالاترین بهترین پیشنهاد و بهترین لایههای درخواست مقایسه میشود.
2. بررسی ادبیات
نقدینگی نقش مهمی در بازارهای مالی دارد. همانطور که Autore و همکاران.(2011)، هنگامی که یک بازار فاقد نقدینگی است، قیمت سهام اغلب در طول معاملات به طور گسترده در نوسان است و بازدهی به دنبال آن است. مطالعات متعدد نشان می دهد که نقدینگی بازار بر فعالیت های تجاری تأثیر می گذارد و نقش اساسی نقدینگی را در بازارهای مالی تأیید می کند. به عنوان مثال، لی و همکاران.(1993) پیشنهاد می کند که متخصصان از نقدینگی برای مدیریت ریسک مرتبط با عدم تقارن اطلاعاتی استفاده می کنند. پرانک (2006) پیشنهاد می کند که اعلان سود هم بر اسپرد پیشنهاد و هم بر عمق نقل قول تاثیر می گذارد (هر دو معیار نقدینگی در ادامه توضیح داده می شوند). این اطلاعات برای هر معاملهگری مفید است، بهویژه برای بازارسازانی که از آن برای برنامهریزی معاملات به عنوان بخشی از استراتژی کلی معاملات استفاده میکنند.
روش های زیادی برای اندازه گیری نقدینگی در طول سال ها ارائه و تحقیق شده است. هاسبروک و سپی (2001) یکی از مطالعات قبلی بودند که معیارهای کمی برای اندازه گیری نقدینگی ارائه کردند. اینها شامل اسپرد پیشنهاد و تقاضا - تفاوت بین بهترین قیمت پیشنهادی و بهترین قیمت خرید - و همچنین عمق قیمتگذاری شده است که به عنوان مجموع حجم سهام در دسترس برای معامله در بهترین قیمت پیشنهادی و بهترین قیمت تعریف میشود. در حالی که (هسبروک و سپی، 2001)، و همچنین مطالعات بعدی، چند معیار دیگر از نقدینگی را ارائه کردند، به نظر میرسد که دو معیار فوقالذکر گستردهترین مورد مطالعه قرار گرفته باشند. بسیاری از معیارهای دیگر ارائه شده (به عنوان مثال، توسط Chordia و همکاران، 2000) دستکاری های مختلف از همان داده ها نیز بود.
علیرغم نقش پذیرفته شده عمق مظنه در اندازهگیری نقدینگی، تا آنجا که ما میدانیم، هیچ تحقیقی در مورد پیشبینی این اندازهگیری به صورت دقیقهای، که برای معاملهگران حیاتی است، انجام نشده است. در مقابل، تحقیقات زیادی در مورد پیشبینی اسپردهای پیشنهادی، از جمله Groß-KlußMann و Hautsch (2013)، Cattivelli و Pirino (2019) و Curato و Lillo (2015) انجام شده است. این حتی با توجه به این واقعیت که تحقیقات در مورد عمق نقلشده اغلب نتایج متناقضی را به همراه داشته است، قابل توجهتر است - برای مثال، (Hasbrouck and Seppi, 2001) دریافتند که اندازهگیریهای نقدینگی حرکتهای مشترک کمی را نشان میدهند در حالی که (Chordia et al., 2000)خلاف آن را کشف کرد.
از تحقیقات فوق الذکر در مورد عمق نقل قول ، بسیار روی بهترین پیشنهاد و بهترین لایه ها متمرکز شده است ، با توجه کمی به لایه های عمیق تر کتاب سفارش محدود. این بار دیگر برخلاف تحقیقات گسترده در مورد محتوای اطلاعاتی لایه های عمیق تر و تأثیر آن بر قیمت ها و گسترش پیشنهادات ، که موضوع بحث گسترده در ادبیات بوده است. به عنوان مثال ، (Mäkinen et al. ، 2019 ؛ Nousi et al. ، 2019) را ببینید.
از زمان معرفی سیستم های تجاری الکترونیکی ، برخی از بازارهای مالی شروع به کار در معرض لایه های عمیق تر کتاب سفارش محدود کردند که در بازارهای فروشنده سنتی غیر عملی بود. مطالعات تأثیر این تغییرات در بازارها نشان می دهد که لایه های عمیق تر حاوی اطلاعاتی است که بر تصمیمات معاملاتی تأثیر می گذارد. به عنوان مثال ، Curato و Lillo (2015) نشان می دهند که متخصصان این اطلاعات را در معاملات ، در حالی که بلومفیلد و همکاران هستند ، بهره می برند.(2005) دریافت که معامله گران در مورد لایه های عمیق تر آگاهی داشتند و سفارشات محدودتری را قرار می دهند. ماداوان و همکاران.(2005) دریافت که بازرگانان هنگامی که دومی تصمیم به افشای چهار لایه برتر گرفت ، سفارشات کمتری را در بورس تورنتو ارسال کردند ، و دوباره نشان می دهد که معامله گران از اطلاعات مربوط به لایه های عمیق تر در تصمیمات تجاری استفاده می کنند. مقاله CAO و همکاران.(2009) نشان می دهد که لایه های عمیق تر کتاب سفارش محدود به کشف قیمت کمک می کند.
علاوه بر این ، تحقیقات اندک سعی در کشف ارتباط شبکه های عصبی عمیق (DNN) برای کتاب سفارش محدود داشت. این درحالی است که معماری DNN با موفقیت برای برنامه های رگرسیون در زمینه های دیگر مورد استفاده قرار گرفته است. مثالها شامل HE (2014) ، یو و زو (2014) و او (2017) است که همه آنها از DNN برای پیش بینی بارهای برق استفاده می کردند. به طور خاص ، او (2014) برای پیش بینی بارهای برق بر ارزیابی شبکه های عصبی عمیق به جلو متمرکز شد.
شبکه های عصبی عمیق به جلو ، دسته ای از الگوریتم های یادگیری هستند که از یک لایه ورودی ، لایه خروجی و لایه های عمیق تر شبکه عصبی تشکیل شده است ، همانطور که توسط Goodfellow و همکاران توضیح داده شده است.(2016). لایه خروجی شبکه عصبی از لایه های عمیق تر شبکه عصبی که به عنوان زنجیره ای از توابع غیر خطی ساخته شده اند ، ساخته شده است ، همچنین به عنوان توابع فعال سازی F (V → ، W → I) شناخته می شود. عمیق ترین لایه اولین یار در نظر گرفته می شود و لایه نهایی ، سطحی ترین لایه خروجی است. لایه اول در لایه دوم تعبیه شده است ، لایه دوم در لایه سوم تعبیه شده است و غیره.
داده ها از لایه ورودی و از طریق هر لایه شبکه جریان می یابد تا به لایه خروجی برسد. این نشان دهنده الگویی است که به عنوان "feed-forward" شناخته می شود، زیرا داده ها فقط در یک جهت جریان دارند. لایه ورودی بردار ویژگی x → را دریافت می کند. این ساختار به صورت گرافیکی در شکل 1 نشان داده شده است.
شکل 1 . ساختار DNN
هر لایه از یک تابع فعال سازی تشکیل شده است که از مجموعه ای از پارامترها یا بردارهای وزنی استفاده می کند. این بردارهای وزنی در ورودی ها ضرب می شوند تا خروجی تولید شود که سپس به لایه بعدی وارد می شود. این ساختار زنجیره ای DNN ها را قادر می سازد تا هنگام محاسبه خروجی، تبدیل های ورودی پیچیده را اجرا کنند. تنظیم پارامترها یا بردارهای وزن به DNN اجازه می دهد تا دقت پیش بینی خود را بهبود بخشد.
یافتن تبدیل بهینه مستلزم یافتن بهترین وزنه ها است. این امر با بهینه سازی یک تابع هزینه، که به عنوان تابع ضرر نیز شناخته می شود، با استفاده از روش گرادیان نزول انجام می شود. این امر با انتشار معکوس به دست می آید (نگاه کنید به Rumelhart و همکاران، 1986)، یک الگوریتم پویا که از حافظه برای کاهش تکرارها در محاسبه مشتقات قانون زنجیره تعداد زیادی وزن در زنجیره غیرخطی استفاده می کند. کارکرد. از آنجایی که مشکل محدب نیست، هیچ تضمینی برای یافتن حداقل مطلق وجود ندارد، فقط یک محلی است. با این حال، نتایج حاصل از حجم وسیعی از تحقیقات یادگیری عمیق اخیر، موفقیت در طیف گسترده ای از کاربردهای دنیای واقعی را نشان می دهد، همانطور که توسط Schmidhuber (2015) توصیف شده است.
در این مقاله، ما بر آنیم تا محتوای اطلاعاتی دفترچه سفارش محدود را به دلیل ارتباط آن با عمق نقلشده بررسی کنیم. به طور خاص، ما از تعداد متغیری از لایههای دفترچه سفارش برای پیشبینی تغییر عمق ثبتنام شش سهم در بورس اوراق بهادار تلآویو برای سالهای 2012، 2013، 2017 و 2018 استفاده میکنیم و از DNN برای الگوریتم پیشبینی خود استفاده میکنیم. نتایج ما نشان میدهد که تغییر در عمق گزارش گزارش را نمیتوان بهتنهایی با بهترین لایههای پیشنهادی و بهترین درخواست پیشبینی کرد، اگرچه افزودن یک لایه به طور قابلتوجهی دقت پیشبینی را بهبود میبخشد. این نشان میدهد که حداقل برخی از لایههای عمیقتر اطلاعات را در مقایسه با نتایج استفاده از بهترین لایههای پیشنهادی و بهترین درخواست به تنهایی ارائه میکنند.
3. روش شناسی
ما داده های کتاب سفارش کامل را از بورس اوراق بهادار تل آویو (TASE) برای سالهای 2012 ، 2013 ، 2017 و 2018 به دست آوردیم. این داده ها از پرونده های متنی سازماندهی شده توسط تاریخ تشکیل شده است. برای هر روز تجارت ، دو پرونده وجود داشت: یکی برای سفارشات ارسال شده و دیگری برای معاملات اجرا شده. پرونده های ارسال شده پرونده نیز شامل درخواست های لغو است.
ما از این پرونده ها برای بازسازی فعالیت تجارت در TASE استفاده کردیم. این امر به ما این امکان را داد تا کتاب سفارش محدود را که برای تحقیقات ما لازم بود ، بازسازی کنیم. بنابراین ، ما برنامه ای را ساختیم که تمام پیشنهادات را در حال اجرا نگه داشته و در هر سطح قیمت سفارشات را بخواهیم و هر زمان که مسابقه ای برگزار شود ، معامله را اجرا می کنیم ، قیمت بازار و همچنین قیمت را در نقاط قیمت مربوطه در هر دو به روز می کنیمبر این اساس پیشنهاد دهید و طرفین را بپرسید.
ما برای هر نوع سفارش نیز حساب کردیم. به عنوان مثال ، سفارشات بازار بلافاصله با قیمت فعلی اجرا می شد ، در حالی که هر زمان که یک مسابقه اتفاق می افتاد ، سفارشات حد مجاز اجرا می شد. هنگامی که یک دستورالعمل کوه یخ (ICE) اجرا شد ، بخش مربوط به سفارش در معرض دید قرار گرفت. دستورالعمل های ویژه ، مانند سفارشات متوقف شده ، نیز در نظر گرفته شد. ما تأیید کردیم که فعالیت معاملاتی برنامه ما با استفاده از پرونده های ذکر شده در بالا با معاملات انجام شده توسط TASE مطابقت دارد. سفارشات ICE و STOP-LOSS در سال 2014 به TASE معرفی شد (Exchange ، 2014) بنابراین فقط داده های سال 2017 و 2018 شامل این نوع سفارشات بود.
در جدول 1 چندین آمار خلاصه در مورد سفارشات ارسال شده و همچنین معاملات اجرا شده توسط شش سهام منتخب ما وجود دارد.
میز 1 . خلاصه آماری.
با استفاده از کتاب سفارش محدود به این ترتیب ، ما توانستیم در طول روز معاملاتی مطالب آن را در هر زمان بندی بازپس گیری کنیم. به عنوان مثال ، می توانیم ببینیم که ساعت 9:53 بامداد ، کتاب سفارش شامل سفارشات معلق در نقاط مختلف قیمت بود. بنابراین ، ما می توانیم از این اطلاعات برای محاسبه حجم کل سفارشات برجسته ، هم از نظر سطح قیمت (لایه) و هم در تمام سطح قیمت ترکیب شده استفاده کنیم.
به منظور ساختن مدل خود ، از داده های لایه های کتاب سفارش بازسازی شده استفاده کردیم. اول ، ما نمایندگی کاملی از لایه های کتاب سفارش ایجاد کردیم که براساس قیمت از پایین ترین تا بالاترین طبقه بندی شده است. اینها توسط (B → I ، A → I) نشان داده شده است که B → I نشان دهنده عکس فوری لایه های سمت پیشنهاد است و A → I نشان دهنده عکس فوری لایه های جانبی است. پس از ارسال هر سفارش ، برنامه ما عکسهای فوری از کتاب سفارش را در هر دو پیشنهاد ضبط کرد و همزمان از طرف سؤال کرد و این عکس های فوری را به صورت سریال برچسب گذاری کرد. من تعداد هر یک از این عکسهای سریال را نشان می دهم. بنابراین ، من از 1… n می روم ، جایی که n تعداد سفارشات یک سهام را برای یک تاریخ خاص نشان می دهد. برای هر روز ، عکسهای فوری داشتیم.
هر دو B → I و A → I شامل زمان ، قیمت و حجم سفارشات مربوطه ارسال شده است. به طور خاص ، B → I را می توان به شرح زیر نشان داد:
کجا: ti= زمانی که عکس فوری اسیر شد.
p 1 i b = بدترین قیمت-به عنوان مثال ، کمترین قیمت که یک خریدار در آن موافقت می کند در عکس فوری من بخرد.
v 1 i b = حجم موجود برای تجارت با بدترین قیمت در عکس فوری i.
P K B I B = بهترین قیمت-به عنوان مثال ، بالاترین قیمتی که یک خریدار موافقت می کند در عکس فوری من خریداری کند.
V K B I B = حجم موجود برای تجارت با بهترین قیمت پیشنهاد در عکس فوری i.
توجه داشته باشید که در بین p k b i b و p 1 i b وجود دارد kشرح- 2 (kشرحبه استثنای بهترین پیشنهادات و بدترین لایه های پیشنهادی) لایه های قیمت فعال (P J I B ، V J I B) ، به عنوان مثال ، قیمت هایی که در آن حجم برای تجارت در دسترس است.
به همین ترتیب ، یک → من می تواند به شرح زیر باشد:
کجا: ti= زمانی که عکس فوری اسیر شد.
p 1 i a = بهترین قیمت ماسک ، به عنوان مثال ، کمترین قیمتی که یک خریدار موافقت می کند در عکس فوری من بفروشد.
v 1 i a = حجم موجود برای تجارت با بهترین قیمت در عکس فوری i.
p k a i a = بالاترین قیمتی که یک خریدار در آن موافقت می کند در عکس فوری اول بفروشد ، به عنوان مثال ، قیمت "بدترین".
v k a i a = حجم موجود برای تجارت با قیمت "بدترین" در عکس فوری i.
توجه داشته باشید که همانطور که در مورد عکسهای فرایند پیشنهادات ، بین P 1 I A و P K A I A وجود دارد که k −2 قیمت فعال (P J I A ، V J I A) وجود دارد ، به عنوان مثال ، قیمت هایی که حجم آن برای تجارت در دسترس است.
برای هر عکس فوری به عنوان من در زمان tمن، ما عکس فوری سفارش را 1 دقیقه جلوتر ، که توسط I + نشان داده شده است محاسبه کردیم:
توجه داشته باشید که در موارد خاص ، مانند آخرین لحظه روز ، I + وجود نداشت و در این موارد ما این ویژگی را حذف کردیم.
ما از این داده ها برای ایجاد نمونه های آموزش و آزمایش برای هر یک از تنظیمات عمق ، به عنوان مثال ، تعداد لایه های قیمت استفاده کردیم که می خواستیم در پیش بینی تغییر در ورود به سیستم به نقل از عمق استفاده کنیم. تعداد لایه ها توسط M نشان داده شده و از 1 تا 9 متغیر است: M ∈ (1 ، 2… 9).
سرانجام ، ورود به سیستم به نقل از عمق LQD به این صورت محاسبه شد:
هنگام محاسبه عمق نقل قول ، از فاصله قیمت هر لایه از بهترین پیشنهاد استفاده کردیم و به جای قیمت واقعی بهترین درخواست را می پرسید. بنابراین ، عمق یک لایه قیمت نمونه ℓ از بهترین پیشنهاد d l i b = p k i b - p l i b است در حالی که عمق یک لایه قیمت نمونه از بهترین درخواست d l i a = p l i a - p 1 i a است.
ما تمام این اطلاعات را در وکتور ویژگی I خود برای تعداد مشخصی از لایه های مورد استفاده برای تجزیه و تحلیل m گنجانده ایم. به طور خاص ، هر نمونه به شرح زیر نشان داده شده است:
f → i m = [l o g (v 1 i a) ، l o g (v 2 i a)… ، l o g (v m i a) ، l o g (v k - m ، i b) ، l o g (v k - m + 1 ، i b) ... ، l o g (v k i b)، D K - M ، I B ، D K - M + 1 ، I B ... ، D K - 1 ، I B ، D 2 I A ، D 3 I A ... ، D M I A] (5)
از کجا: M = تعداد لایه هایی که برای ایجاد بردار ویژگی استفاده می شود.
v 1 i a = حجم سؤال موجود برای تجارت در "بهترین حالت".
V M I A = حجم پرسیدن در دسترس برای تجارت در لایه M "بدترین حالت" در بردار ویژگی.
v k ، i b = حجم پیشنهاد موجود برای تجارت در "بهترین پیشنهاد".
v k-m ، i b = حجم پیشنهاد موجود برای تجارت در لایه m "بدترین پیشنهاد" در بردار ویژگی.
D K-1 ، I B = تفاوت بین قیمت دوم "بهترین" و قیمت "بهترین پیشنهاد".
d k-m ، i b = تفاوت بین قیمت لایه m "بدترین پیشنهاد" در بردار ویژگی با قیمت "بهترین پیشنهاد".
D 2 I A = تفاوت بین قیمت دوم "بهترین" و قیمت "بهترین".
d m i a = تفاوت بین قیمت لایه m "بدترین" در وکتور ویژگی با قیمت "بهترین حالت".
این بردار ویژگی برای پیش بینی تغییر در ورود به سیستم به نقل از عمق برای یک عکس فوری خاص یا δ LQD استفاده شدمن، که به شرح زیر محاسبه شده است:
ما تجزیه و تحلیل را در مورد 10 تنظیم مختلف M ، به عنوان مثال ، هر تعداد لایه قیمت ، به منظور تشخیص اینکه آیا لایه های قیمت عمیق تر کتاب سفارش محدود ، اطلاعاتی را در هنگام پیش بینی تغییر در ورود به سیستم به نقل از عمق 1 دقیقه پیش رو انجام داده ایم.
این تحلیل به صورت سالانه برای شش سهم انجام شد. برای هر سهام و سال، داده ها به سه مجموعه تقسیم شد: قطار، توسعه و آزمایش. ما از این سه مجموعه برای اعتبارسنجی متقابل مدل به شرح زیر استفاده کردیم: مجموعه داده قطار برای آموزش مدل استفاده شد در حالی که مجموعه داده توسعه دهنده برای انتخاب بهترین پارامترها برای شبکههای عصبی استفاده شد. مجموعه داده قطار و توسعه دهنده شامل 10. 5 (10 و نیم) ماه اول سال بود. برای ایجاد توسعه دهنده، ما به طور تصادفی 10 درصد از داده های قطار را نمونه برداری کردیم. سپس، ما از 1. 5 (یک و نیم) ماه آخر سال برای مجموعه داده آزمایشی، به عنوان مثال، خارج از نمونه استفاده کردیم. این آزمون برای اندازه گیری عملکرد مدل در پیش بینی تغییر در LQD استفاده شد.
ما DNN را با استفاده از تابع ضرر میانگین خطای مطلق (MAE) در آزمون آموزشی آموزش دادیم و زمانی که MAE در مجموعه داده توسعهدهنده تثبیت شد یا کاهش یافت، آموزش را متوقف کردیم. سپس، ما MAE و همچنین کسری از زمان هایی را محاسبه کردیم که در آن مدل ما به درستی جه ت-مثبت یا منفی- Δ LQD را در مجموعه داده آزمایشی پیش بینی کرد.
همانطور که در بالا ذکر شد، هدف ما این بود که تعیین کنیم آیا لایههای قیمتی عمیقتر کتاب سفارش حدی اطلاعاتی را هنگام پیشبینی Δ LQD ارائه میدهند یا خیر.منو اگر چنین است، تعداد لایه های ایده آل برای استفاده در هنگام انجام چنین پیش بینی. همانطور که قبلاً ذکر شد، ما تصمیم گرفتیم با Feed Forward DNN کار کنیم، که در سایر برنامه های رگرسیون موفقیت آمیز نشان داده اند. با این حال، از آنجایی که هدف ما این بود که تعیین کنیم آیا لایههای عمیقتر اطلاعات بیشتری را در پیشبینی ارائه میکنند، ما روی به حداکثر رساندن عملکرد مدل تمرکز نکردیم - به عنوان مثال، با مقایسه مدلهای مختلف یا اعمال پیشآموزش، همانطور که توسط He (2017) و انجام شد. او (2014).
ما از یک شبکه عصبی عمیق پیشخور (DNN) برای مدل خود با سه لایه در پیکربندی شبکه عصبی استفاده کردیم. ما این پیکربندی را همانطور که توسط He (2014) توصیه شده بود، انتخاب کردیم، که پیکربندی های مختلف DNN را برای رگرسیون در مسئله ای با اندازه مشابه مقایسه کرد. الگوریتم ما نه بردار ویژگی مختلف را ایجاد کرد که مربوط به هر تعداد لایههای کتاب سفارش مورد استفاده در تحلیل و پیشبینی است. بنابراین، ما یک بردار ویژگی داشتیم که لایههای کتاب سفارش صفر را نشان میدهد (به عنوان مثال، فقط پیشنهاد و درخواست)، بردار ویژگی دیگری که یک لایه کتاب سفارش را نشان میدهد، بردار ویژگی دیگری که نشاندهنده دو لایه کتاب سفارش و غیره است. سپس، الگوریتم ما هر یک از اینها را تغذیه کرد. بردارها را در DNN مشخص کنید. این نه DNN با ساختار مشابه بهجز اولین لایه DNN، که با طول بردار ویژگی مطابقت دارد، به دست آورد.
برای عملکرد فعال سازی ، ما Relu را انتخاب کردیم ، یک تابع محبوب که توسط Ryu و همکاران توصیه می شود.(2017) ، که نتایج عملکردهای مختلف فعال سازی را برای اهداف رگرسیون مقایسه کرد. برای همه آزمایشات ، ما از همان تنظیمات استفاده کردیم و فقط تعداد لایه ها را تغییر دادیم. این تضمین می کند که ما می توانیم هرگونه تغییر در نتایج را به لایه های شماره کتاب سفارش محدود که در پیش بینی استفاده می شود ، نسبت دهیم.
تمام کد پردازش داده ما در پایتون نوشته شده است. DNN در Tensorflow اجرا شد. ما پردازش داده های خود و همچنین تمام الگوریتم های یادگیری ماشین را بر روی سرورهای ارائه شده توسط Google Cloud Platform اجرا کردیم.
به منظور برآورد موفقیت در پیش بینی δ LQDمن، ما از دو معیار استفاده کردیم: MAE و صحیح جهت (CD). این فرمول ها در زیر نشان داده شده است:
y i ^ مقدار پیش بینی شده برای δ lqd استمن,
حرفمنمقدار واقعی Δ LQD استمن، و < SPAN> برای عملکرد فعال سازی ، ما Relu را انتخاب کردیم ، یک عملکرد محبوب که توسط Ryu و همکاران توصیه می شود.(2017) ، که نتایج عملکردهای مختلف فعال سازی را برای اهداف رگرسیون مقایسه کرد. برای همه آزمایشات ، ما از همان تنظیمات استفاده کردیم و فقط تعداد لایه ها را تغییر دادیم. این تضمین می کند که ما می توانیم هرگونه تغییر در نتایج را به لایه های شماره کتاب سفارش محدود که در پیش بینی استفاده می شود ، نسبت دهیم.