ALGOR!THMIC VÀ GIAO DỊCH TẦN SỐ CAO K"(aE

V

..F

C.Sa.A

汽达

ALGOR!THMIC VÀ GIAO DỊCH TẦN SỐ CAO K"(aE

L:号a

（ g) （ [ （ ]

1

3,1 . +=11./

Anh动= G

JOSE ALVARO SERASTIAN PENALVE CARTEA JNUNGNL

reirard

× ±, ff

生

GIAO DỊCH THUẬT TOÁN VÀ GIAO DỊCH TẦN SUẤT CAO

Việc thiết kế các thuật toán giao dịch đòi hỏi các mô hình toán học phức tạp, phân tích dữ liệu tài chính vững chắc và hiểu biết sâu sắc về cách thức hoạt động của thị trường và sàn giao dịch. Trong cuốn sách giáo khoa này, các tác giả phát triển các mô hình giao dịch thuật toán trong các bối cảnh như: thực hiện các lệnh lớn, tạo lập thị trường, nhắm mục tiêu VWAP và các lịch trình khác, giao dịch cặp hoặc thu thập tài sản, và thực hiện giao dịch trong dark pool. Các mô hình này dựa trên cách thức hoạt động của sàn giao dịch, liệu thuật toán có giao dịch với các nhà giao dịch am hiểu hơn (lựa chọn đối nghịch) hay không, và loại thông tin có sẵn cho người tham gia thị trường ở cả tần suất cực cao và thấp. Giao dịch thuật toán và tần suất cao là cuốn sách đầu tiên kết hợp các phương pháp phức tạp

mô hình toán học, sự kiện thực nghiệm và kinh tế tài chính, đưa người đọc từ những ý tưởng cơ bản đến nghiên cứu và thực hành tiên tiến

Nếu bạn muốn hiểu cách thức hoạt động của thị trường điện tử hiện đại, thông tin nào mang lại lợi thế giao dịch và cách những người tham gia thị trường khác có thể ảnh hưởng đến lợi nhuận của các thuật toán, thì đây chính là cuốn sách dành cho bạn.

A LVARO CA RTEA là Giảng viên Toán Tài chính tại Đại học University College London. Trước khi gia nhập UCL, ông là Phó Giáo sư Tài chính tại Đại học Carlos III, Madrid-Tây Ban Nha (2009-2012) và từ năm 2002 đến năm 2009, ông là Giảng viên (có biên chế) tại Khoa Kinh tế, Toán và Thống kê, Đại học Birkbeck, London. Trước đây, ông là Giảng viên Toán Tài chính của JP Morgan tại Cao đẳng Exeter, Đại học Oxford.

SEBA STIAN JAIMUNGAL là Phó Giáo sư và Trưởng khoa Nghiên cứu Sau đại học tại Khoa Khoa học Thống kê thuộc Đại học Toronto, nơi ông giảng dạy trong các chương trình Tiến sĩ và Thạc sĩ Tài chính Toán học. Ông tư vấn cho các ngân hàng lớn và quỹ đầu cơ, tập trung vào việc triển khai các công cụ định giá phái sinh tiên tiến và các chiến lược giao dịch thuật toán. Ông cũng là biên tập viên cộng tác của Tạp chí SIAM về Toán học Tài chính, Tạp chí Quốc tế về Tài chính Lý thuyết và Ứng dụng, tạp chí Risks và bản tin Argo. Jaimungal là Phó Chủ tịch nhóm hoạt động Kỹ thuật Tài chính & Toán học của SIAM và nghiên cứu của ông được công bố rộng rãi trên các tạp chí học thuật và chuyên ngành. Các mối quan tâm gần đây của ông bao gồm giao dịch tần suất cao và thuật toán, điều khiển ngẫu nhiên ứng dụng, trò chơi trường trung bình, quyền chọn thực, mô hình hàng hóa và định giá phái sinh.

JOs E PE NA LVA là Phó Giáo sư tại Đại học Carlos III ở Madrid, nơi ông giảng dạy các chương trình Tiến sĩ và Thạc sĩ Tài chính, cũng như bậc đại học. Hiện ông đang nghiên cứu về các mô hình thông tin và cấu trúc vi mô thị trường, và nghiên cứu của ông đã được công bố trên Econometrica và các tạp chí học thuật hàng đầu khác.

THUẬT TOÁN VÀ

GIAO DỊCH TẦN SUẤT CAO

Đại học ALVARO CARTEA Cao đẳng Luân Đôn

SEBASTIAN JAIMUNGAL Đại học Toronto

Đại học JOSE PENALVA Carlos III de Madrid

NHÀ XUẤT BẢN ĐẠI HỌC CAMBRIDGE

Nhà in Đại học, Cambridge CB2 8BS, Vương quốc Anh

Nhà xuất bản Đại học Cambridge là một phần của Đại học Cambridge

Nó thúc đẩy sứ mệnh của trường đại học bằng cách phổ biến kiến thức trong việc theo đuổi giáo dục, học tập và nghiên cứu ở cấp độ xuất sắc quốc tế cao nhất

www.cambridge.org

Thông tin về tiêu đề này: www.cambridge.org/9781107091146

Alvaro Cartea, Sebastian Jaimungal và Jose Penalva 2015

Ấn phẩm này có bản quyền. Ngoại trừ các trường hợp ngoại lệ theo luật định và các điều khoản của thỏa thuận cấp phép tập thể có liên quan, không được phép sao chép bất kỳ phần nào nếu không có sự cho phép bằng văn bản của Nhà xuất bản Đại học Cambridge.

Xuất bản lần đầu năm 2015

Được in tại Vương quốc Anh bởi Bell and Bain Ltd

Hồ sơ danh mục cho ấn phẩm này có sẵn tại Thư viện Anh

Thư viện Quốc hội lập danh mục dữ liệu xuất bản Cartea, Alvaro.

Giao dịch thuật toán và tần suất cao / Alvaro Cartea, Sebastian Jaimungal, Jose Penalva

pagescm Bao gồm tài liệu tham khảo và mục lục. ISBN 978-1-107-09114-6 (Bìa cứng: giấy kiềm)

Giao dịch chứng khoán điện tử. Mô hình toán học. 2. Tài chính. Mô hình toán học
Suy đoánMô hình toán học.I. Tiêu đề.

HG4515.95.C387 2015332.64dc232015018946

ISBN 978-1-107-09114-6 Bìa cứng

Các nguồn tài nguyên bổ sung cho ấn phẩm này tại www.cambridge.org/9781107091146

Nhà xuất bản Đại học Cambridge không chịu trách nhiệm về tính bền vững hoặc tính chính xác của các URL cho các trang web internet bên ngoài hoặc của bên thứ ba được đề cập trong ấn phẩm này và không đảm bảo rằng bất kỳ nội dung nào trên các trang web đó là, hoặc sẽ vẫn

Gửi đến các cô gái của tôi, theo thứ tự xuất hiện là Victoria, Amaya, Carlota và Penelope.

-AC

Gửi đến bố mẹ tôi, Korisha và Paul, cùng các anh chị em Shelly, Cristina và đặc biệt là anh trai Curt vì đã luôn truyền cho tôi sự phấn khích và động viên trong suốt chặng đường.

— SJ

Gửi Nuria, Daniel, Jose Maria và Adelina. Vì sự kiên nhẫn và động viên của họ trên từng bước đường, và không bao giờ

mất niềm tin.

— JP

Mục lục

Trang lời nói đầu xi Cách đọc cuốn sách này xvi

Phần I Cấu trúc vi mô và sự kiện thực nghiệm

Giới thiệu Phần I

Thị trường điện tử và Sổ lệnh giới hạn 1

1.1 Thị trường điện tử và cách thức hoạt động của chúng 1.2 Phân loại người tham gia thị trường 1.3 Giao dịch trên thị trường điện tử 1.3.1 Lệnh và sàn giao dịch 1.3.2 Cấu trúc sàn giao dịch thay thế 1.3.3 Đồng định vị 1.3.4 = Các loại lệnh mở rộng 1.3.5 Phí sàn giao dịch 1.4 Sổ lệnh giới hạn 1.5 Tài liệu tham khảo và bài đọc được chọn

Sơ lược về cấu trúc vi mô của thị trường tài chính 2

2.1 Tạo lập thị trường 2.1.1 Mô hình tạo lập thị trường Grossman-Miller 2.1.2 Chi phí giao dịch 2.1.3 Đo lường tính thanh khoản 2.1.4 Tạo lập thị trường bằng lệnh giới hạn 2.2 Giao dịch trên lợi thế thông tin 2.3 Tạo lập thị trường với bất lợi thông tin 2.3.1 Biến động giá 2.3.2 Nhà giao dịch thanh khoản nhạy cảm với giá 2.4 Tài liệu tham khảo và bài đọc đã chọn

3 Bằng chứng thực nghiệm và thống kê: Giá cả và lợi nhuận

3.1Giới thiệu 3.1.1Dữ liệu 3.1.2Giá tài sản hàng ngày và lợi nhuận

3.1.3 Hoạt động giao dịch hàng ngày 3.1.4 Khả năng dự đoán giá hàng ngày 3.2 Giá tài sản và lợi nhuận trong ngày 3.3 Thời gian giữa các lần đến 3.4 Độ trễ và kích thước tích tắc 3.5 Bản chất phi Markovian của những thay đổi về giá 3.6 Sự phân mảnh thị trường 3.7 Kinh nghiệm về giao dịch cặp 3.8 Tài liệu tham khảo và các bài đọc được chọn

Bằng chứng thực nghiệm và thống kê: Hoạt động và chất lượng thị trường

4.1 Khối lượng và Biến động Hàng ngày 4.2 Hoạt động Trong ngày 4.2.1 Các Mẫu hình Khối lượng Trong ngày 4.2.2 Các Mẫu hình Khối lượng Trong giây 4.2.3 Các Mẫu hình Giá 4.3 Giao dịch và Chất lượng Thị trường 4.3.1 Chênh lệch 4.3.2 Biến động 4.3.3 Độ sâu Thị trường và Quy mô Giao dịch 4.3.4 Tác động Giá 4.3.5 Đi bộ trong LOB và Tác động Giá Vĩnh viễn 4.4 Thông báo và Hoạt động Hủy 4.5 Lệnh Ẩn 4.6 Tài liệu tham khảo và Tài liệu Đọc Chọn lọc

Phần II Công cụ toán học

Giới thiệu về Phần II

5 Kiểm soát tối ưu ngẫu nhiên và dừng lại

5.1 Giới thiệu 5.2 Ví dụ về các bài toán điều khiển trong tài chính 5.2.1 Bài toán Merton 5.2.2 Bài toán thanh lý tối ưu 5.2.3 Đặt lệnh giới hạn tối ưu 5.3 Điều khiển cho các quá trình khuếch tán 5.3.1 Nguyên lý lập trình động 5.3.2 Phương trình lập trình động / Phương trình Hamilton-Jacobi Bellman 5.3.3 Kiểm chứng 5.4 Điều khiển cho các quá trình đếm 5.4.1 Nguyên lý lập trình động 5.4.2 Phương trình lập trình động / Phương trình Hamilton-Jacobi Bellman 115

5.4.3Phản xạ và nhảy kết hợp 5.5Dừng tối ưu 5.5.1Nguyên lý lập trình động 5.5.2Phương trình lập trình động 5.6Dừng và điều khiển kết hợp 5.7Tài liệu tham khảo và bài đọc đã chọn

Phần III Giao dịch thuật toán và giao dịch tần suất cao 13 Giới thiệu về Phần III

Thực hiện tối ưu với Giao dịch liên tục 6

6.1 Giới thiệu 6.2 Mô hình 6.3 Thanh lý không có hình phạt chỉ có tác động tạm thời 6.4 Mua lại tối ưu với hình phạt cuối cùng và tác động tạm thời 6.5 Thanh lý với tác động giá vĩnh viễn 6.6 Thực hiện với bộ tối đa hóa tiện ích theo cấp số nhân 6.7 Tác động giá tạm thời phi tuyến tính 6.8 Tài liệu tham khảo và bài đọc được chọn 6.9 Bài tập

Thực hiện tối ưu với giao dịch liên tục II 1

7

7.1 Giới thiệu 7.2 Mua lại tối ưu với giới hạn giá 7.3 Kết hợp luồng lệnh 7.3.1 Diễn giải xác suất 7.4 Thanh lý tối ưu trên thị trường sáng và tối 7.4.1 Giải pháp rõ ràng khi Dark Pool thực hiện đầy đủ 7.5 Tài liệu tham khảo và bài đọc được chọn 7.6 Bài tập

OptimalExecution với lệnh giới hạn và lệnh thị trường 8

8.1Giới thiệu 8.2Thanh lý chỉ với lệnh giới hạn 8.3Thanh lý với Bộ tối đa hóa tiện ích theo cấp số nhân 8.4Thanh lý với lệnh giới hạn và lệnh thị trường 1968.5Thanh lý với lệnh giới hạn và lệnh thị trường Lịch trình mục tiêu 2068.6Tài liệu tham khảo và bài đọc được chọn 2092098.7Bài tập

212

9

Khối lượng mục tiêu

9.1Giới thiệu 2129.2Mục tiêu tỷ lệ phần trăm tốc độ giao dịch của thị trường 2152169.2.1Giải quyết DPE khi mục tiêu tỷ lệ giao dịch

9.2.2 Tỷ lệ giao dịch quay lại mức trung bình ngẫu nhiên 9.2.3 Biểu diễn xác suất 9.2.4 Mô phỏng 9.3 Tỷ lệ phần trăm khối lượng tích lũy 9.3.1 Mô hình Poisson phức hợp của khối lượng 9.3.2 Tỷ lệ khối lượng quay lại mức trung bình ngẫu nhiên 9.3.3 Biểu diễn xác suất 9.4 Bao gồm tác động của các nhà giao dịch khác 9.4.1 Biểu diễn xác suất 9.4.2 Ví dụ: Khối lượng quay lại mức trung bình ngẫu nhiên 9.5 Bộ tối đa hóa tiện ích 2399.5.1 Giải quyết DPE với khối lượng xác định 2409.6 Tài liệu tham khảo và bài đọc đã chọn 2432439.7 Bài tập

10 Tạo lập thị trường

24610.1 Giới thiệu 10.2 Tạo lập thị trường 10.2.1 Tạo lập thị trường không hạn chế hàng tồn kho 10.2.2 Tạo lập thị trường tại chỗ 10.2.3 Tạo lập thị trường tối ưu hóa khối lượng 10.3 Tối đa hóa tiện ích Nhà tạo lập thị trường 10.4 Tạo lập thị trường với lựa chọn bất lợi 10.4.1 Tác động của lệnh thị trường lên giá trung bình 10.4.2 Alpha ngắn hạn và lựa chọn bất lợi 10.5 Tài liệu tham khảo và bài đọc được chọn 10.6 Bài tập

Chiến lược giao dịch theo cặp và chênh lệch giá thống kê 11

11.1 Giới thiệu 11.2 Dải tần Ad Hoc 11.3 Lựa chọn dải tần tối ưu 11.3.1 Bài toán thoát tối ưu 11.3.2 Bài toán vào tối ưu 11.3.3 Vào-ra tối ưu hai mặt 11.4 Giá logarit đồng tích hợp với Short-Term-Alph: 11.4.1 Thiết lập mô hình 11.4.2 Bài toán tối ưu hóa của tác nhân 11.4.3 Giải DPE 11.4.4 Thí nghiệm số 11.5 Tài liệu tham khảo và tài liệu đọc đã chọn

295

Mất cân bằng đơn hàng 12

12.1Giới thiệu

295

12.2 Các tính năng trong ngày 12.2.1 Mô hình chuỗi Markov 12.2.2 Mô hình hóa lệnh thị trường chung 12.2.3 Mô hình hóa giá tăng 12.3 Các tính năng hàng ngày 12.4 Thanh lý tối ưu 30812.4.1 Bài toán tối ưu hóa 12.5 Tài liệu tham khảo và bài đọc được chọn 31312.6 Bài tập 313

Tính toán ngẫu nhiên cho tài chính 315 Phụ lục A A.1 Quá trình khuếch tán 315

A.1.1 Chuyển động Brown 316316 A.1.2 Tích phân ngẫu nhiên 319 A.2 Quá trình nhảy A.3 Quá trình Poisson ngẫu nhiên kép 322 A.4 Feynman-Kac và PDE 325326 A.5 Tài liệu tham khảo và bài đọc chọn lọc

Tài liệu tham khảo 327337 Thuật ngữ 342 Chủ đề indez

Lời nói đầu

Chúng tôi viết cuốn sách này vì chúng tôi cảm thấy rằng các cuốn sách hiện có không cung cấp một cái nhìn đủ rộng để giải quyết vô số vấn đề phát sinh khi cố gắng hiểu và thiết kế một thuật toán giao dịch thành công. Cuốn sách này tổng hợp các quan điểm và nền tảng đa dạng của ba tác giả theo cách kết nối kinh tế học cơ bản, nền tảng thực nghiệm của dữ liệu tần suất cao, cùng các công cụ và mô hình toán học để tạo ra một góc nhìn cân bằng về giao dịch thuật toán và giao dịch tần suất cao. Cuốn sách này được phát triển từ mối quan tâm của các tác giả trong lĩnh vực thuật toán.

Tài chính vi mô và tần số cao, cũng như các khóa học sau đại học được giảng dạy tại Đại học London, Đại học Toronto, Đại học Carlos III de Madrid, IMPA và Đại học Oxford. Độc giả cần có kiến thức cơ bản về tài chính liên tục, nhưng giả định rằng họ chưa có kiến thức về điều khiển tối ưu ngẫu nhiên và dừng lỗ. Để cuốn sách được trọn vẹn, chúng tôi bao gồm một phụ lục với các công cụ và kết quả tính toán ngẫu nhiên chính cần thiết. Nội dung tài liệu nên thu hút nhiều đối tượng độc giả và lý tưởng cho một khóa học sau đại học về Giao dịch Thuật toán ở bậc Thạc sĩ hoặc Tiến sĩ. Sách cũng lý tưởng cho những người đang làm việc trong lĩnh vực tài chính muốn kết hợp kiến thức và chuyên môn trong ngành với các mô hình toán học mạnh mẽ cho giao dịch thuật toán. Chúng tôi hoan nghênh ý kiến đóng góp! Vui lòng gửi đến algo.trading.book@gmail.com

Hướng dẫn tóm tắt về nội dung

Cuốn sách này được chia thành ba phần, đưa người đọc từ hoạt động của các sàn giao dịch điện tử đến nền kinh tế đằng sau chúng, sau đó đến các thuật toán liên quan, và cuối cùng là các mô hình và bài toán giao dịch thuật toán. Phần I bắt đầu bằng việc mô tả các yếu tố cơ bản của thị trường điện tử.

và những cách thức chính mà mọi người tham gia vào thị trường: với tư cách là những nhà giao dịch chủ động khai thác lợi thế thông tin để kiếm lời từ các cơ hội sinh lời tiềm năng, hoặc là những người tạo lập thị trường, đồng thời chào mua và bán với mức giá có lợi. Một cuốn sách giáo khoa về giao dịch thuật toán sẽ không đầy đủ nếu sự phát triển

của các chiến lược không được thúc đẩy bởi thông tin mà những người tham gia thị trường nhìn thấy trên thị trường điện tử. Do đó, cần dành không gian để thảo luận về

Dữ liệu và hàm ý thực nghiệm. Dữ liệu cho phép chúng ta trình bày bối cảnh quyết định số phận cuối cùng của một thuật toán. Bằng cách xem xét giá, khối lượng và chi tiết của sổ lệnh giới hạn, người đọc sẽ có được cái nhìn tổng quan cơ bản về một số vấn đề chính mà bất kỳ thuật toán nào cũng cần tính đến, chẳng hạn như thông tin trong giao dịch, đặc tính biến động giá, tính đều đặn trong động lực trong ngày của khối lượng, độ biến động, chênh lệch, v.v.

Phần II phát triển các công cụ toán học để phân tích các thuật toán giao dịch. Chương về kiểm soát tối ưu ngẫu nhiên và dừng cung cấp một cách tiếp cận thực tế đối với tài liệu ít chuẩn mực hơn trong sách giáo khoa toán học tài chính. Chương này cũng được viết để những độc giả chưa từng tiếp xúc với các kỹ thuật này có thể trang bị cho mình những công cụ cần thiết để hiểu các mô hình toán học đằng sau một số chiến lược giao dịch thuật toán.

Phần III của cuốn sách đi sâu vào mô hình hóa các chiến lược giao dịch thuật toán. Hai chương đầu tiên đề cập đến các chiến lược thực hiện tối ưu, trong đó tác nhân phải thanh lý hoặc mua một vị thế lớn trong một khoảng thời gian được chỉ định trước và giao dịch liên tục chỉ bằng các lệnh thị trường. Chương 6 đề cập đến vấn đề thực hiện cổ điển khi các giao dịch của nhà đầu tư tác động đến giá của tài sản và cũng điều chỉnh mức độ khẩn cấp mà nhà đầu tư mong muốn thực hiện chương trình. Trong Chương 7, chúng tôi phát triển ba mô hình thực hiện, trong đó nhà đầu tư: i) thực hiện chương trình thực hiện miễn là giá của tài sản không vi phạm ranh giới quan trọng, ii) kết hợp dòng lệnh vào chiến lược của mình để tận dụng các xu hướng ở mức giá trung bình do áp lực một chiều ở phía mua hoặc bán của thị trường gây ra, và i) giao dịch ở cả địa điểm sáng và nhóm tối. Trong Chương 8, chúng tôi giả định rằng mục tiêu của nhà đầu tư là thực hiện một

vị thế trên cửa sổ giao dịch, nhưng chỉ sử dụng lệnh giới hạn hoặc sử dụng cả lệnh giới hạn và lệnh thị trường. Hơn nữa, chúng tôi trình bày các chiến lược thực hiện trong đó nhà đầu tư cũng theo dõi một lịch trình cụ thể như một phần của chương trình thanh lý.

Chương 9 đề cập đến các thuật toán thực thi nhắm mục tiêu vào các lịch trình dựa trên khối lượng. Chúng tôi phát triển các chiến lược cho các nhà đầu tư muốn theo dõi tổng khối lượng giao dịch trên thị trường bằng cách nhắm mục tiêu: Phần trăm khối lượng, Phần trăm khối lượng tích lũy và Giá trung bình có trọng số theo khối lượng, còn được gọi là VWAP.

Ba chương cuối cùng đề cập đến nhiều chủ đề khác nhau trong giao dịch thuật toán. Chương 10 trình bày cách các nhà tạo lập thị trường lựa chọn vị trí đặt lệnh giới hạn trong sách. Các mô hình được phát triển xem xét cách các chiến lược phụ thuộc vào các yếu tố khác nhau, bao gồm thái độ e ngại rủi ro hàng tồn kho của nhà tạo lập thị trường, lựa chọn đối nghịch và các xu hướng ngắn hạn trong động lực của giá trung bình.

Cuối cùng, Chương 11 dành riêng cho chênh lệch thống kê và giao dịch theo cặp, và Chương 12 cho thấy cách thông tin về khối lượng được cung cấp trong sổ lệnh giới hạn được sử dụng để cải thiện các thuật toán thực hiện

Phong cách của cuốn sách

Trong việc lựa chọn nội dung và cách trình bày của cuốn sách, chúng tôi đã cố gắng cung cấp một cái nhìn tổng quan chặt chẽ nhưng dễ hiểu về các vấn đề cơ bản chính trong thị trường

Cấu trúc vi mô và một số chủ đề thực nghiệm của giao dịch điện tử, lấy thị trường chứng khoán Hoa Kỳ làm thị trường quen thuộc nhất với độc giả. Những nội dung này cung cấp cơ sở cho việc phân tích toán học toàn diện về các mô hình thực hiện giao dịch, thuật toán dựa trên khối lượng, tạo lập thị trường, kinh doanh chênh lệch giá thống kê, giao dịch cặp và các chiến lược dựa trên thông tin dòng lệnh. Hầu hết các chương trong Phần II đều kết thúc bằng các bài tập với nhiều mức độ khó khác nhau. Một số bài tập bám sát nội dung được trình bày trong chương và yêu cầu người đọc: giải quyết một số bài toán bằng cách nhìn nhận chúng từ một góc độ khác; điền vào chỗ trống của một số phép tính; xem đây như một lời mời thử nghiệm thêm. Chúng tôi đã thiết lập một trang web, http://www.algorithmic-trading.org, từ đó độc giả có thể tải xuống các tập dữ liệu và mã MATLAB để hỗ trợ cho các thử nghiệm như vậy. Cuốn sách này không đề cập đến bất kỳ khía cạnh công nghệ thông tin nào của thuật toán.

Giao dịch theo nhịp điệu. Nó cũng không đề cập chi tiết đến một số khía cạnh nhất định của chất lượng thị trường hoặc thảo luận về các vấn đề quản lý.

Lời cảm ơn

Chúng tôi xin chân thành cảm ơn những người đã dành thời gian đọc một số phần của bản thảo và đóng góp những phản hồi rất hữu ích: Ali Al-Aradi, Gene Amromin, Robert Almgren, Ryan Francis Donnelly, Luhui Gan, John Goodacre, Hui Gong, Tianyi Jia, Hoi Kong, Tim Leung, Siyuan Li, Eddie Ng, Zhen Qin, Jason Ricci, Anton Rubisov, Mark Stevenson, Mikel Tapia và Jamie Walton. Chúng tôi cũng xin cảm ơn các sinh viên đã theo học các khóa học của chúng tôi tại University College London, University of Toronto, University of Oxford, IMPA và Universidad Carlos II de Madrid.

Alvaro biết ơn lòng hiếu khách và sự hào phóng của Nhóm Tài chính tại Trường Kinh doanh Said, Đại học Oxford, đặc biệt cảm ơn Tim Jenkinson và Colin Mayer, và Khoa Khoa học Thống kê, Đại học Toronto, nơi phần lớn cuốn sách này được viết.

Sebastian biết ơn sự hiếu khách của Viện Toán học, Đại học Oxford và Khoa Toán học, Đại học College London, nơi một số phần của cuốn sách này được viết.

Jose rất biết ơn sự đón tiếp nồng hậu của Khoa Toán, Đại học College London và Khoa Tài chính tại Trường Kinh doanh Cass, nơi một số phần của cuốn sách này được viết, cũng như trường đại học quê hương ông, Khoa Kinh doanh của Đại học Carlos II, đã tạo điều kiện cho ông thực hiện những chuyến thăm này. Ông cũng xin cảm ơn Artem Novikov của TradingPhysics vì đã sẵn sàng hỗ trợ ông trong việc tiếp cận dữ liệu và làm rõ những vấn đề cụ thể mà các nhà giao dịch và kỹ thuật viên gặp phải trong môi trường giao dịch tần suất cao.

Tháng 5 năm 2015, Oxford, London, Toronto, Madrid, Mallorca

Cách đọc cuốn sách này

Cuốn sách này dành cho những ai muốn tìm hiểu cách phát triển các khía cạnh toán học của Giao dịch Thuật toán. Nó lý tưởng cho các khóa học sau đại học về Giao dịch Thuật toán ở bậc Thạc sĩ hoặc Tiến sĩ, và cũng lý tưởng cho những người đang làm việc trong lĩnh vực tài chính muốn kết hợp kiến thức và chuyên môn trong ngành với các mô hình toán học mạnh mẽ cho giao dịch thuật toán.

Phần lớn nội dung của cuốn sách này có thể được trình bày trong một khóa học chuyên sâu một học kỳ/kỳ như một phần của khóa học Sau đại học về Toán học/Kỹ thuật Tài chính, Tài chính Tính toán và Toán ứng dụng. Một sinh viên điển hình ở giai đoạn này sẽ học phép tính ngẫu nhiên như một phần của các khóa học khác, nhưng sẽ không được dạy về điều khiển tối ưu ngẫu nhiên hoặc thành thạo cách thức hoạt động của thị trường điện tử hiện đại. Do đó, họ được khuyến khích mạnh mẽ đọc Phần I của cuốn sách để: hiểu rõ cách thức hoạt động của thị trường điện tử; hiểu các khái niệm cơ bản về lý thuyết cấu trúc vi mô làm nền tảng cho cách thị trường đạt được giá cân bằng khi có các loại rủi ro khác nhau; và nghiên cứu các vấn đề thống kê cách điệu về động lực của giá cổ phiếu trên thị trường điện tử hiện đại. Và đọc Phần II để tìm hiểu các công cụ điều khiển tối ưu ngẫu nhiên, vốn là yếu tố thiết yếu cho Phần III, nơi chúng tôi phát triển các mô hình toán học phức tạp cho giao dịch thuật toán và giao dịch tần số cao Những người có hiểu biết vững chắc về phép tính ngẫu nhiên và điều khiển tối ưu

Có thể bỏ qua Phần II của sách và đọc kỹ Phần II. Tuy nhiên, chúng tôi vẫn khuyến khích họ đọc Phần I để hiểu rõ hơn về các đặc điểm thống kê cách điệu của thị trường, và để hiểu rõ hơn lý do tại sao các mô hình thuật toán được thiết kế theo những cách cụ thể hoặc hướng đến những mục tiêu cụ thể.

Đối với khóa học ngắn gọn và cô đọng hơn về giao dịch thuật toán, sinh viên nên tập trung tìm hiểu về sổ lệnh giới hạn, Chương 1, sau đó là kiểm soát tối ưu trong Phần II, rồi tập trung vào các Chương đã chọn trong Phần III, ví dụ như Chương 6, 8 và 10.

Những độc giả trong ngành tài chính có một số hiểu biết về cách thức tổ chức thị trường điện tử có thể muốn bỏ qua Chương 1 nhưng nên đọc các chương khác đề cập đến lý thuyết cấu trúc vi mô và bằng chứng thực nghiệm và thống kê về giá cổ phiếu trước khi đi sâu vào chi tiết của các mô hình toán học trong Phần III.

Cấu trúc vi mô và sự kiện thực nghiệm

Giới thiệu Phần I

Trong phần đầu của cuốn sách, chúng tôi sẽ giới thiệu tổng quan về cách thức hoạt động của các thị trường điện tử cơ bản. Chương 1 xem xét các vấn đề thực tiễn chính khi giao dịch: các tài sản chính được giao dịch là gì và các loại hình tham gia chính, động lực thúc đẩy họ giao dịch và cách thức tương tác giữa họ. Chương này cũng xem xét hoạt động cơ bản của một sàn giao dịch điện tử: lệnh giới hạn, lệnh thị trường và các loại lệnh khác, cũng như sổ lệnh giới hạn và cấu trúc phí cơ bản. Chương này kết thúc bằng việc xem xét cách thức tổ chức sổ lệnh giới hạn và kinh nghiệm cơ bản khi thực hiện giao dịch. Chương 2 cung cấp tổng quan về lý thuyết kinh tế của giao dịch: những gì

là những lực lượng kinh tế thúc đẩy lợi thế cạnh tranh của các nhà tạo lập thị trường và các nhà giao dịch khác, và cách thức họ tương tác với nhau. Chương này đề cập đến các mô hình tạo lập thị trường cơ bản, mô tả cách thanh khoản bị ảnh hưởng bởi rủi ro hàng tồn kho hoặc sự hiện diện của các nhà giao dịch có hiểu biết hơn. Chương này cũng xem xét sự đánh đổi của nhà tạo lập thị trường giữa tần suất thực hiện lệnh và lợi nhuận kỳ vọng trên mỗi giao dịch, và cách các nhà giao dịch có hiểu biết khai thác tối ưu lợi thế thông tin của họ bằng cách giao dịch dần dần để hạn chế rò rỉ thông tin về tác động của họ lên dòng lệnh. Chương 3 và 4 xem xét dữ liệu thị trường chứng khoán để cung cấp tổng quan về một số

của các quy luật kinh nghiệm cơ bản có thể quan sát được. Chương 3 tập trung vào các đặc tính chuỗi thời gian của giá và lợi nhuận, theo tần suất hàng ngày và trong ngày. Chương này xem xét các vấn đề như độ trễ và tác động của các hạn chế đối với biến động giá, cũng như cấu trúc động của thay đổi giá, sự phân mảnh thị trường tại các thị trường Hoa Kỳ và sự đồng biến động của giá tài sản thúc đẩy giao dịch theo cặp tài sản. Chương 4 tập trung vào khối lượng và chất lượng thị trường. Chương này xem xét mối quan hệ giữa khối lượng và độ biến động, cũng như các mô hình đã biết về khối lượng và giá. Tiếp theo là tổng quan về các thước đo khác nhau về thanh khoản và chất lượng thị trường: chênh lệch, độ biến động, độ sâu và quy mô giao dịch, và tác động của giá. Chương kết thúc bằng việc xem xét các vấn đề khác liên quan đến giao dịch như các mô hình trong tin nhắn, hủy lệnh, thực hiện và lệnh ẩn.

1 Thị trường điện tử và Sổ lệnh giới hạn

Để hiểu cách thức hoạt động của thị trường điện tử, trước tiên chúng ta phải hiểu bối cảnh giao dịch trên thị trường tài chính. Trong chương này, Mục 1.1, chúng tôi cung cấp tổng quan về cách thức hoạt động của thị trường điện tử, bao gồm các thảo luận ngắn về cổ phiếu, cổ phiếu ưu đãi, quỹ tương hỗ và quỹ đầu cơ. Chúng tôi cũng thảo luận về các loại hình tham gia thị trường (nhà giao dịch nhiễu, nhà giao dịch/nhà đầu cơ chênh lệch giá, nhà tạo lập thị trường) và trong Mục 1.2, chúng tôi sẽ mô tả cách thức cấu trúc của các sàn giao dịch điện tử, lệnh giới hạn và lệnh thị trường là gì (cũng như các loại lệnh khác), cách các sàn giao dịch thu thập lệnh trong sổ lệnh giới hạn (LOB) và phí áp dụng cho người tham gia thị trường. Cuối cùng, Mục 1.4 cung cấp chi tiết về cách thức LOB được xây dựng và cách các lệnh thị trường tương tác với nó.

Thị trường điện tử và cách thức hoạt động của chúng

Ngày nay, có rất nhiều loại hợp đồng tài chính được giao dịch trên thị trường điện tử, vì vậy, chúng ta hãy cùng xem xét sơ lược và khái quát những loại chính. Phổ biến nhất trong số này là cổ phiếu hoặc cổ phần công ty. Cổ phiếu là quyền sở hữu đối với các công ty. Các quyền này được các công ty sử dụng để huy động vốn. Tại Hoa Kỳ, để những cổ phiếu này được giao dịch trên sàn giao dịch điện tử, chúng phải được niêm yết trên sàn giao dịch, và điều này đồng nghĩa với việc đáp ứng một số yêu cầu nhất định về số lượng cổ đông, giá, v.v. Quy trình niêm yết thường gắn liền với đợt phát hành cổ phiếu ra công chúng lần đầu (phát hành cổ phiếu lần đầu ra công chúng, hay IPO). Giá trị cơ bản của những cổ phiếu này bắt nguồn từ bản chất của hợp đồng mà nó đại diện. Ở dạng đơn giản nhất, đây là quyền sở hữu đối với công ty, cho phép chủ sở hữu quyền nhận một phần lợi nhuận bằng nhau của công ty (do đó có tên là "cổ phần") và can thiệp vào quá trình ra quyết định của công ty thông qua quyền biểu quyết tại các cuộc họp đại hội đồng cổ đông thường niên của công ty. Những cổ phiếu này được gọi là cổ phiếu phổ thông (hay cổ phiếu phổ thông) và là loại cổ phiếu phổ biến nhất. Một công cụ chính khác được các công ty lớn sử dụng để huy động vốn là

Trái phiếu. Trái phiếu là hợp đồng mà theo đó công ty cam kết trả cho người sở hữu một khoản thu nhập thường xuyên (lãi suất) nhưng không trao cho họ quyền quyết định. Sự khác biệt giữa cổ phiếu và trái phiếu khá rõ ràng: cổ đông không được đảm bảo về mức độ và tần suất nhận cổ tức nhưng có quyền biểu quyết, trái phiếu.

Cổ phiếu ưu đãi được đảm bảo thanh toán định kỳ, được xác định trước và không có quyền biểu quyết. Có những công cụ khác mang đặc điểm của cả hai loại hợp đồng này, trong đó quen thuộc nhất là cổ phiếu ưu đãi. Cổ phiếu ưu đãi là sự kết hợp giữa cổ phiếu và trái phiếu: chúng giống như trái phiếu ở chỗ người nắm giữ không có quyền biểu quyết và nhận được thu nhập được sắp xếp trước, nhưng thu nhập họ nhận được ít được đảm bảo hơn: cách xử lý pháp lý của nó là vốn chủ sở hữu, chứ không phải nợ. Sự khác biệt này đặc biệt có liên quan khi công ty gặp khó khăn về tài chính, vì nợ có vị trí cao hơn tất cả vốn chủ sở hữu, do đó, trong trường hợp thanh lý, các khoản nợ của chủ nợ được ưu tiên hơn tài sản của công ty và họ được thanh toán trước. Chủ sở hữu vốn chủ sở hữu, nếu được thanh toán, chỉ được thanh toán sau khi tất cả các khoản nợ của chủ nợ được thanh toán. Hệ thống các hợp đồng tài chính được chia thành các loại tài sản khác nhau hoặc

được phân loại theo đặc điểm của tài sản cơ sở. Cổ phiếu và cổ phiếu ưu đãi thuộc về Cổ phiếu. Trái phiếu thuộc về một loại tài sản riêng và thường được phân biệt với tiền mặt (các khoản đầu tư có đặc điểm là thời hạn đầu tư ngắn hạn và thường có mức bảo lãnh rất cao và lợi nhuận thấp, chẳng hạn như tài khoản thị trường tiền tệ, tiền gửi tiết kiệm, tín phiếu kho bạc, v.v.). Ngoài ra còn có các loại tài sản kỳ lạ hơn như Ngoại hối (FX), Hàng hóa, Bất động sản hoặc Tài sản. Nhà đầu tư sẽ tìm thấy những loại tài sản khác nhau này trên các sàn giao dịch điện tử, thường dưới dạng chứng khoán chuyên biệt như quỹ tương hỗ và quỹ giao dịch trên sàn (ETF), cho phép nhà đầu tư đầu tư vào các loại tài sản này trên một thị trường quen thuộc, giống như thị trường cổ phiếu, giúp đơn giản hóa quá trình đa dạng hóa và có tính thanh khoản cao hơn. Quỹ tương hỗ là một sản phẩm đầu tư hoạt động như một khoản đầu tư ủy thác

Quản lý quỹ. Nghĩa là, khi một nhà đầu tư mua một quỹ tương hỗ, nhà đầu tư sẽ giao tiền mặt cho một công ty quản lý tài chính, công ty này sẽ sử dụng số tiền này để xây dựng danh mục tài sản theo mục tiêu đầu tư của quỹ. Mục tiêu này bao gồm tài sản và chiến lược đầu tư của quỹ, và tất nhiên, cả phí quản lý. Tài sản của quỹ có thể thuộc nhiều loại hình tài sản khác nhau, bao gồm tất cả các loại được mô tả ở trên: cổ phiếu, trái phiếu, tiền mặt, ngoại hối, bất động sản, v.v. Chiến lược đầu tư của quỹ đề cập đến phong cách đầu tư, chủ yếu là việc quỹ được quản lý chủ động hay thụ động theo dõi một chỉ số. Nhà đầu tư đầu tư vào quỹ sẽ tham gia vào cả việc tăng giá

và khấu hao tài sản theo phân bổ của nhà quản lý quỹ. Để hoàn vốn đầu tư, tức là chuyển đổi khoản đầu tư thành tiền mặt, các lựa chọn của nhà đầu tư phụ thuộc vào loại quỹ mà họ đã mua. Có hai loại quỹ tương hỗ chính: quỹ mở và quỹ đóng. Quỹ đóng là quỹ tương hỗ không được hoàn vốn: quỹ phát hành một số lượng cổ phiếu cố định, thường chỉ một lần, khi thành lập, và nhà đầu tư không thể bán lại cổ phiếu cho quỹ. Quỹ bán cổ phiếu ban đầu thông qua IPO và những cổ phiếu này được niêm yết trên sàn giao dịch, nơi các nhà đầu tư mua và bán cổ phiếu cho nhau. Quỹ mở là quỹ có số lượng cổ phiếu khác nhau. Cổ phiếu có thể

được tạo ra để đáp ứng nhu cầu của các nhà đầu tư mới, hoặc bị hủy bỏ (do quỹ mua lại) khi các nhà đầu tư tìm cách rút vốn. Quá trình này diễn ra mỗi ngày một lần, khi giá trị tài sản ròng của quỹ (Giá trị Tài sản Ròng, NAV) được xác định.

sau khi thị trường đóng cửa. Do đó, các quỹ đóng, không phải điều chỉnh danh mục đầu tư để đáp ứng nhu cầu của nhà đầu tư, có yêu cầu thanh khoản khác với quỹ mở và do đó có thể giao dịch ở mức giá khác với NAV của chúng.

Một loại quỹ rất phổ biến, giống như quỹ đóng, được giao dịch trên các sàn giao dịch điện tử, là ETF. Giống như quỹ tương hỗ, ETF hoạt động như một công ty quản lý đầu tư được ủy quyền, nhưng chúng khác nhau ở hai điểm chính. Thứ nhất, ETF thường có các chiến lược đầu tư rất cụ thể, thường hướng đến việc tạo ra lợi nhuận tương đương với một chỉ số thị trường cụ thể (ví dụ: S&P500). Thứ hai, chúng không bắt buộc phải mua lại cổ phiếu của nhà đầu tư. Thay vào đó, nếu nhà đầu tư muốn trả lại cổ phiếu của mình cho quỹ, quỹ có thể chuyển cho nhà đầu tư một rổ chứng khoán tương tự như rổ chứng khoán của ETF. Điều này có thể thực hiện được vì ETF bán cổ phiếu theo các đơn vị rất lớn (Đơn vị Sáng tạo), sau đó được chia nhỏ và bán lại dưới dạng cổ phiếu riêng lẻ trên sàn giao dịch. Một Đơn vị Sáng tạo có thể lên tới 50.000 cổ phiếu. Nhìn chung, nhận thức chung mà người ta thường thấy là các nhà đầu tư muốn giảm chi phí giao dịch và tìm kiếm các khoản đầu tư đa dạng sẽ ưa chuộng ETF, trong khi các nhà đầu tư đang tìm kiếm các nhà quản lý có kỹ năng lựa chọn cổ phiếu hoặc kỹ năng đặc biệt tương tự và muốn đánh bại thị trường sẽ ưa chuộng quỹ tương hỗ. Một số công ty đầu tư cảm thấy rằng các quy định được áp dụng cho các công ty tương hỗ

Việc các nhà quản lý quỹ đảm bảo họ hoàn thành nghĩa vụ ủy thác đối với nhà đầu tư là quá hạn chế. Để giải quyết vấn đề này, họ đã tạo ra các quỹ đầu cơ, những quỹ theo đuổi các chiến lược giao dịch tích cực hơn và ít yêu cầu về quy định và minh bạch hơn. Do sự giám sát lỏng lẻo hơn của cơ quan quản lý, việc tiếp cận các phương tiện đầu tư này phần lớn chỉ giới hạn ở các nhà đầu tư được công nhận, những người được kỳ vọng sẽ có hiểu biết tốt hơn và có khả năng giao dịch với các nhà quản lý quỹ. Mặc dù các quỹ này không được giao dịch trên các sàn giao dịch, nhưng các nhà quản lý của chúng là những người tham gia tích cực vào các thị trường đó. Ngoài ra còn có các chứng khoán khác được giao dịch trên các sàn giao dịch điện tử; cụ thể là

Có rất nhiều giao dịch điện tử trên thị trường phái sinh, đặc biệt là hợp đồng tương lai, hoán đổi và quyền chọn, và các hợp đồng này được viết trên nhiều loại tài sản khác nhau (trái phiếu, ngoại hối, hàng hóa, cổ phiếu, chỉ số). Các khái niệm và kỹ thuật chúng tôi phát triển trong cuốn sách này áp dụng cho việc giao dịch bất kỳ tài sản nào trong số này, mặc dù chúng tôi chủ yếu tập trung các ví dụ và ứng dụng vào cổ phiếu. Tuy nhiên, khi thiết kế các thuật toán và chiến lược, người ta phải luôn tính đến các vấn đề cụ thể liên quan đến loại tài sản mà mình đang giao dịch, cũng như các đặc điểm cụ thể của sàn giao dịch điện tử cụ thể và mục tiêu giao dịch của các nhà đầu tư khác mà người ta có thể gặp ở đó.

1.2 Phân loại người tham gia thị trường

Khi thiết kế chiến lược và thuật toán giao dịch, điều quan trọng là phải hiểu các loại hành vi giao dịch khác nhau mà người ta có thể gặp phải trên các sàn giao dịch này. Ví dụ, người ta phải xem xét ai giao dịch trên các sàn giao dịch này và tại sao. Động cơ của mọi người đều rõ ràng, họ muốn kiếm tiền, nhưng điều quan trọng là

để xem xét điều gì thúc đẩy họ giao dịch theo cách họ có thể muốn kiếm tiền - vì trong nhiều trường hợp, điều này sẽ tương tác với các lựa chọn thiết kế thuật toán của chúng tôi và ảnh hưởng đến việc các thuật toán khác nhau có đạt được mục tiêu giao dịch mong muốn hay không và đạt được như thế nào

Chúng ta hãy bắt đầu từ việc tạo ra các đối tượng giao dịch mà chúng ta vừa thảo luận. Đối tượng quen thuộc nhất trong số này là cổ phiếu. Chúng ta đã thấy rằng các công ty, hay đúng hơn là các nhà quản lý của họ, phát hành cổ phiếu hoặc vốn chủ sở hữu để huy động vốn. Những cổ phiếu này là một trong những đối tượng giao dịch chính được tạo ra khi một công ty niêm yết trên sàn giao dịch chứng khoán, thường là thông qua IPO. Một công ty phát hành cổ phiếu để huy động vốn cho các hoạt động kinh tế đa dạng, từ sản xuất máy nghe nhạc điện tử đến khai thác quặng ở những nơi xa xôi. Điều quan trọng cần nhớ là những cổ phiếu này là quyền sở hữu của một công ty và do đó phải tuân theo các quyết định của công ty. Do đó, một loại người tham gia là các nhà quản lý công ty, những người tạo ra một số tài sản được giao dịch trên các sàn giao dịch và đôi khi sẽ tích cực tham gia vào thị trường bằng cách tăng hoặc giảm nguồn cung cổ phiếu của công ty họ, ví dụ, thông qua chào bán cổ phiếu thứ cấp (SSO), mua lại cổ phiếu, cổ tức bằng cổ phiếu, chuyển đổi trái phiếu thành cổ phiếu (và ngược lại), v.v. Chúng ta cũng đã thấy rằng có những đối tượng khác được giao dịch trên các sàn giao dịch. Trong vốn chủ sở hữu

thị trường chúng ta tìm thấy các quỹ (quỹ tương hỗ, ETF) do các công ty quản lý tài chính tạo ra để thương mại hóa các dịch vụ của họ. Các quỹ này quản lý một số lượng lớn các hợp đồng tài chính, là những người tham gia rất tích cực vào các sàn giao dịch điện tử và tạo ra một phần đáng kể các giao dịch được quan sát thấy trên các sàn giao dịch. Những nhà giao dịch *phía cung' này có thể có các mục tiêu đầu tư dài hạn (ví dụ: các quỹ tập trung vào 'đầu tư giá trị', loại chiến lược tiêu biểu của Warren Buffett) hoặc tập trung vào các chiến lược rất tức thời (ví dụ: các ETF sao chép lợi nhuận của S&P500). Ngoài ra còn có các nhà giao dịch độc quyền giao dịch dựa trên lợi thế giao dịch (đôi khi là thực, đôi khi là ảo), từ các quỹ đầu cơ lớn mà chúng ta đã thấy trước đó, đến các nhà giao dịch trong ngày nhỏ lẻ di chuyển vào và ra khỏi các vị thế tài sản từ văn phòng tại nhà của họ. Các nhà giao dịch độc quyền giao dịch dựa trên lợi thế cạnh tranh của họ: có thể là xác định tài sản có giá cơ bản sai, xác định động lực giá hoặc thay đổi giá dựa trên tâm lý, có khả năng kỹ thuật đặc biệt để xử lý thông tin thị trường và xác định các mô hình (nhà giao dịch kỹ thuật), có khả năng dự đoán biến động giá dựa trên tin tức (có thể là thông báo về số liệu kinh tế của chính phủ hoặc xử lý nguồn cấp dữ liệu Twitter) hoặc xác định sự khác biệt giá thoáng qua không hợp lý giữa các tài sản tương đương (nhà đầu tư chênh lệch giá). Một nhóm người tham gia thị trường khác rất quan trọng là các nhà đầu tư thường xuyên

và*các nhà giao dịch cơ bản. Đây là những nhà đầu tư có quyền sử dụng trực tiếp đối với các tài sản đang được giao dịch. Họ có thể là những cá nhân mua cổ phiếu với hy vọng được hưởng lợi từ sự tăng trưởng của công ty khi giá trị kinh tế được tạo ra và cổ phiếu tăng giá. Hoặc, họ có thể muốn tái cân bằng các khoản đầu tư của mình do hoàn cảnh thay đổi (để đáp ứng nhu cầu tiền mặt đột ngột, thay đổi sở thích rủi ro hoặc triển vọng tương lai). Họ có thể là các công ty sử dụng hợp đồng tài chính để phòng ngừa rủi ro, chẳng hạn như thay đổi trong

Giá cả đầu vào và đầu ra từ hoạt động sản xuất của họ. Các nhà giao dịch hợp đồng tương lai dầu Brent, đồng hoặc điện lo lắng về các vấn đề phi tài chính như số lượng nhà máy lọc dầu ngừng hoạt động để sửa chữa, việc phát hiện ra các phương pháp mới để truyền tải điện an toàn, hay liệu cơn bão nhiệt đới ngoài khơi Florida có chuyển thành bão và đổ bộ gần Miami hoặc Dade hay không. Và, không thể bỏ qua việc các chính phủ cũng có liên quan đến kết quả thị trường. Họ có thể muốn quản lý tiền tệ, phát hành nợ để tài trợ cho chi tiêu công, hoặc mua lại tài sản để tăng thanh khoản hoặc duy trì sự ổn định của thị trường. Tác động của sự tương tác giữa tất cả các nhà giao dịch này là một trong những vấn đề chính.

được nghiên cứu trong lĩnh vực cấu trúc vi mô thị trường, mà chúng ta sẽ làm quen trong Chương 2, và giúp chúng ta xây dựng các khái niệm và vấn đề nền tảng cho phương pháp giao dịch của mình. Chúng tôi phân biệt ba nhóm nhà giao dịch (hay chiến lược giao dịch) chính dưới đây.

Các nhà giao dịch cơ bản (hoặc tiếng ồn hoặc thanh khoản): những người bị thúc đẩy bởi các yếu tố cơ bản kinh tế bên ngoài sàn giao dịch 2. Các nhà giao dịch có thông tin: các nhà giao dịch kiếm lợi nhuận từ việc tận dụng thông tin không phải

bị ảnh hưởng bởi giá thị trường bằng cách giao dịch tài sản với kỳ vọng giá trị của chúng sẽ tăng hoặc giảm

Nhà tạo lập thị trường: các nhà giao dịch chuyên nghiệp kiếm lợi nhuận từ việc tạo điều kiện trao đổi một tài sản cụ thể và khai thác kỹ năng của họ trong việc thực hiện giao dịch

Thông thường, người ta có thể coi nhà giao dịch chênh lệch giá là loại hình giao dịch thứ tư, tuy nhiên, vì mục đích của chúng tôi, chúng tôi gộp nhà giao dịch chênh lệch giá vào những nhà giao dịch am hiểu, hành động theo dự đoán biến động giá. Ngoài ra, mặc dù việc gộp chung nhà giao dịch nhiễu và nhà giao dịch thanh khoản không phải là điều bất thường, nhưng việc gộp họ với nhà giao dịch cơ bản lại là điều bất thường. Thuật ngữ "nhà giao dịch nhiễu" thường được sử dụng để mô tả giao dịch không phụ thuộc vào bất kỳ sự kiện nào tác động đến giá thị trường, và "nhà giao dịch thanh khoản" được sử dụng cho các nhà giao dịch bị thúc đẩy bởi nhu cầu thanh lý hoặc tích lũy vị thế vì lý do thanh khoản, không phụ thuộc vào các sự kiện thị trường.

Mặt khác, "nhà giao dịch cơ bản" là thuật ngữ thường dành riêng cho các nhà giao dịch có chiến lược đầu tư trung và dài hạn dựa trên phân tích chi tiết về hoạt động kinh doanh thực tế làm nền tảng cho tài sản được giao dịch. Điều này tự nhiên sẽ phân loại họ là nhà giao dịch có hiểu biết. Tuy nhiên, phần lớn chiến lược giao dịch của họ xuất phát từ việc quản lý danh mục đầu tư và sự đánh đổi rủi ro-lợi nhuận, vốn có rất ít thông tin giá ngắn hạn ngoài thông tin chứa đựng trong quy mô lớn của các vị thế của họ. Do đó, xét theo quan điểm của một thuật toán giao dịch tần suất cao, việc coi họ là những giao dịch "nhiễu" so với các sự kiện thị trường cụ thể trong phạm vi của thuật toán là hợp lý. Tuy nhiên, miễn là một nhà giao dịch cơ bản giao dịch dựa trên thông tin có tác động đến giá ngắn hạn (chẳng hạn như hiểu biết về khối lượng của một sự thay đổi đáng kể trong các vị thế), họ cũng có thể được xếp vào nhóm "nhà giao dịch có hiểu biết". Chúng ta có thể coi các loại hình tạo lập thị trường là giao dịch "thụ động" hoặc "phản ứng". Đây là

giao dịch có lợi nhuận từ kiến thức chi tiết về quy trình giao dịch và thích ứng với 'thị trường' khi hoàn cảnh thay đổi, trong khi hai loại đầu tiên đại diện cho

Giao dịch chủ động hơn hoặc giao dịch hung hăng hơn chỉ diễn ra để khai thác những lợi thế thông tin cụ thể có được bên ngoài môi trường giao dịch nhiễu loạn và các nhà giao dịch cơ bản chỉ có tác động hỗ trợ lên các biến động ngắn hạn, trong khi các nhà giao dịch am hiểu dự đoán các biến động giá ngắn hạn. Sự khác biệt này rất hữu ích khi thiết lập chiến lược giao dịch, mặc dù ranh giới giữa hai yếu tố này không phải lúc nào cũng rõ ràng. Các nhà giao dịch chuyên nghiệp thường tận dụng lợi thế thông tin có được từ thực tiễn giao dịch vào các chiến lược giao dịch mà họ sử dụng để tạo lập thị trường. Một sai lầm phổ biến là đánh đồng việc tạo lập thị trường với việc cung cấp thanh khoản và

Giao dịch được hình thành với việc lấy thanh khoản. Hoạt động tạo lập thị trường thường ưu tiên việc cung cấp thanh khoản, nhưng một chiến lược tạo lập thị trường cụ thể đôi khi có thể cung cấp thanh khoản, trong khi những chiến lược khác lại yêu cầu điều đó. Tương tự, giao dịch có thông tin không phải lúc nào cũng diễn ra thông qua các lệnh chủ động, và đôi khi có thể được triển khai tốt hơn thông qua các lệnh thụ động giúp tăng thanh khoản. Trong Chương 10, chúng tôi phát triển các thuật toán cho các nhà tạo lập thị trường, những người luôn cung cấp thanh khoản cho thị trường. Các thuật toán này có thể được mở rộng để thể hiện cách thức tạo lập thị trường thay đổi khi nhà tạo lập thị trường có thể lấy thanh khoản từ thị trường. Hơn nữa, trong Chương 8, chúng tôi phát triển các mô hình thực hiện tối ưu, trong đó các chiến lược của tác nhân vừa lấy vừa cung cấp thanh khoản.

Giao dịch trên thị trường điện tử. 1.3

Sau khi tìm hiểu về thị trường điện tử, chúng ta hãy xem xét cách thức triển khai. Có nhiều cách để triển khai một thị trường điện tử, nhưng về cơ bản, tất cả đều hướng đến việc tạo ra một phương thức để mọi người thể hiện mong muốn giao dịch và một công cụ kết nối những người muốn mua với những người muốn bán.

1.3.1 Lệnh và Sàn giao dịch

Trong thiết lập cơ bản, một thị trường điện tử có hai loại lệnh: Lệnh thị trường (MO) và Lệnh giới hạn (LO). MO thường được coi là lệnh tích cực, tìm cách thực hiện giao dịch ngay lập tức. Bằng cách gửi MO, nhà giao dịch cho biết họ muốn mua hoặc bán một lượng cổ phiếu nhất định ở mức giá tốt nhất hiện có, và điều này (thường) sẽ dẫn đến giao dịch ngay lập tức (thực hiện). Mặt khác, LO được coi là lệnh thụ động, vì nhà giao dịch gửi LO cho biết họ muốn mua hoặc bán ở một mức giá nhất định, tối đa đến một lượng cổ phiếu nhất định. Vì giá được chào trong LO thường thấp hơn giá thị trường hiện tại (cao hơn giá mua tốt nhất đối với LO bán và thấp hơn giá bán tốt nhất đối với LO mua), nên nó sẽ không dẫn đến giao dịch ngay lập tức và do đó sẽ phải đợi cho đến khi nó được khớp với một lệnh mới muốn giao dịch ở mức giá được chào (và được thực hiện) hoặc nó bị hủy (hủy). Các lệnh được quản lý bởi một công cụ khớp lệnh và sổ lệnh giới hạn (LOB).

LOB theo dõi các lệnh đến và đi. Công cụ khớp lệnh sử dụng một thuật toán được xác định rõ ràng để xác định thời điểm giao dịch có thể xảy ra, và nếu có, tiêu chí nào sẽ được sử dụng để chọn lệnh sẽ được thực hiện. Hầu hết

Hình 1.1 Ảnh chụp nhanh LOB của NASDAQ sau sự kiện thứ 10.000 trong ngày. Thanh màu xanh biểu thị các LOB bán khả dụng, thanh màu đỏ biểu thị các LOB mua khả dụng.

thị trường ưu tiên MO hơn LO và sau đó sử dụng ưu tiên giá-thời gian theo đó, nếu có MO mua, lệnh mua sẽ được khớp với LO đang chờ bán theo cách sau: đầu tiên, lệnh đến sẽ được khớp với LO đưa ra mức giá tốt nhất (đối với lệnh mua, là LO bán có giá thấp nhất), sau đó, nếu số lượng cầu ít hơn số lượng được chào bán ở mức giá tốt nhất, thuật toán khớp lệnh sẽ chọn các LO cũ nhất, tức là những LO được niêm yết sớm nhất và thực hiện chúng theo thứ tự cho đến khi số lượng MO được thực hiện hoàn toàn. Nếu MO yêu cầu nhiều hơn số lượng được chào bán ở mức giá tốt nhất, sau khi thực hiện tất cả các LO đang chờ ở mức giá tốt nhất, thuật toán khớp lệnh sẽ tiến hành thực hiện đối với các LO ở mức giá tốt thứ hai, sau đó là mức giá tốt thứ ba, v.v. cho đến khi toàn bộ lệnh được thực hiện. Các LO có giá ngày càng tệ hơn được gọi là LO nằm sâu hơn trong LOB và quá trình mà một lệnh thị trường đang vào được thực hiện đối với các LO đang chờ nằm sâu hơn trong LOB được gọi là 'đi theo sổ sách'. Phần 1.4 cung cấp góc nhìn chi tiết hơn về cách xây dựng LOB và cách MO thực hiện sổ lệnh giới hạn. Hình 1.1 cho thấy ảnh chụp nhanh sổ lệnh giới hạn (LOB) trên NASDAQ sau

Sự kiện thứ 10.000 trong ngày của hai cổ phiếu FARO và HPQ, vào ngày 1 tháng 10 năm 2013 (xem tiểu mục 3.1.1 để biết mô tả về cách xây dựng dữ liệu sự kiện thô). Hai sự kiện này khá khác nhau. Sự kiện ở bảng bên trái tương ứng với HPQ, một tài sản được giao dịch thường xuyên và thanh khoản cao. LOB của HPQ có các LOB được ghi nhận tại mỗi tick out (ít nhất) 20 tick out so với giá trung bình. Ở bảng bên phải, chúng ta có LOB của FARO. FARO là một tài sản ít được giao dịch và thanh khoản thấp. Tài sản này có các lệnh mua và bán được ghi nhận thưa thớt và các khoảng trống không đều trong LOB. Chúng tôi sẽ thảo luận thêm chi tiết về ví dụ này trong Mục 1.4.

1.3.2 Cấu trúc trao đổi thay thế

Cách tiếp cận trên không phải là cách duy nhất để tổ chức một sàn giao dịch. Ví dụ, người ta có thể sử dụng một thuật toán khớp lệnh thay thế, chẳng hạn như quy tắc tỷ lệ được sử dụng trong một số thị trường tiền tệ. Với quy tắc tỷ lệ, các MO được khớp lệnh.

So với các LO được niêm yết ở mức giá tốt nhất, không có quy tắc ưu tiên thời gian nào được áp dụng cho số lượng niêm yết. Cũng có những thị trường, ví dụ như thị trường tương lai, kết hợp cả hai, theo tỷ lệ và theo thời gian.

Ngoài thiết lập cơ bản này, còn có một số biến thể trong cách các sàn giao dịch tổ chức các lệnh chào bán và giao dịch. Ví dụ, một số thị trường áp dụng mức độ ưu tiên bổ sung cho các lệnh đến từ một loại nhà giao dịch nhất định (hoặc là nhà tạo lập thị trường được chỉ định, hoặc, ở một số thị trường, là nhà giao dịch cung được chỉ định). Nhiều sàn giao dịch cũng sử dụng đấu giá tại các thời điểm cụ thể. Việc có một phiên đấu giá ban đầu và/hoặc phiên đấu giá đóng cửa, tức là một phiên đấu giá vào đầu ngày giao dịch và/hoặc một phiên đấu giá để đóng cửa thị trường, là khá điển hình. Ngoài ra, một sàn giao dịch sẽ sử dụng phiên đấu giá sau khi thị trường tạm dừng giao dịch (ví dụ, sau khi giới hạn biến động được kích hoạt) để tạo điều kiện thuận lợi cho quá trình chuyển đổi trở lại giao dịch chủ động. Một khía cạnh quan trọng khác khi mô tả một sàn giao dịch là

Sự minh bạch (và chi phí) là rõ ràng. Tại Hoa Kỳ, có sự phân biệt rõ ràng (về mặt pháp lý) giữa các sàn giao dịch được quản lý (như NASDAQ và NYSE) có nghĩa vụ cụ thể phải công bố thông tin về trạng thái của các LOB của họ, và các thị trường điện tử khác (mạng lưới giao dịch điện tử (ECN), dark pool và nội bộ hóa môi giới đại lý). Ngoài các định nghĩa pháp lý, chúng tôi thường phân biệt thị trường lit (sổ lệnh mở) với thị trường dark dựa trên việc thông tin sổ lệnh giới hạn có được công khai hay không. Trong các thị trường lit, có nhiều khác biệt về cách thức và mức giá thông tin có sẵn. Ví dụ, NASDAQ có cơ chế báo cáo sổ lệnh dựa trên lệnh, theo đó sàn giao dịch ghi lại mọi thông báo và mỗi LO được gán một mã số nhận dạng lệnh, sau đó có thể được sử dụng để khớp lệnh với các sự kiện tiếp theo, chẳng hạn như hủy hoặc thực hiện. Các thị trường khác (đặc biệt là NYSE và NYSE MKT/AMEX) sử dụng phương pháp sổ lệnh cấp độ, theo đó thị trường nhận được thông báo mỗi khi có sự kiện tác động đến sổ lệnh, nhưng không theo dõi các lệnh đã đăng nên chúng không thể được khớp với các lệnh hủy hoặc thực hiện tiếp theo. Trong suốt cuốn sách này, hầu hết các thuật toán mà chúng tôi phát triển đều giả định rằng tác nhân đang giao dịch trên một thị trường sáng, nơi cô ấy có thể quan sát LOB. Tuy nhiên, trong Chương 7, chúng tôi sẽ thảo luận về dark pool và phát triển các thuật toán để thực hiện tối ưu khi tác nhân giao dịch đồng thời trên cả thị trường sáng và thị trường tối.

Đồng định vị 1.3.3

Các sàn giao dịch cũng kiểm soát lượng và mức độ chi tiết của thông tin bạn nhận được (ví dụ: bạn có thể sử dụng nguồn cấp dữ liệu hợp nhất/công khai với chi phí thấp hoặc trả chi phí tương đối cao hơn cho nguồn cấp dữ liệu trực tiếp/độc quyền từ các sàn giao dịch). Họ cũng kiếm tiền từ nhu cầu về tốc độ bằng cách cho thuê không gian máy tính/máy chủ bên cạnh các công cụ khớp lệnh của họ, một quy trình được gọi là dịch vụ đặt máy chủ chung. Thông qua dịch vụ đặt máy chủ chung, các sàn giao dịch có thể cung cấp dịch vụ đồng nhất cho khách hàng giao dịch với mức giá cạnh tranh. Việc đặt các công cụ giao dịch của nhà giao dịch tại một địa điểm chung thuộc sở hữu của sàn giao dịch giúp đơn giản hóa khả năng cung cấp dịch vụ đồng nhất của sàn giao dịch vì họ có thể kiểm soát phần cứng kết nối mỗi khách hàng với công cụ giao dịch, tức là cáp (do đó

tất cả đều có cùng một cáp với cùng độ dài) và mạng lưới. Điều này đảm bảo rằng tất cả các nhà giao dịch tại các điểm đặt máy chủ đều có cùng tốc độ truy cập nhanh và không bị bất lợi (ít nhất là về mặt phần cứng do sàn giao dịch cung cấp). Đương nhiên, điều này tạo ra sự phân biệt rõ ràng giữa các nhà giao dịch được đặt máy chủ và những người không được đặt máy chủ. Những người không được đặt máy chủ sẽ luôn gặp bất lợi về tốc độ. Điều này sau đó trở thành một vấn đề đối với các cơ quan quản lý, những người phải đảm bảo rằng các sàn giao dịch duy trì khả năng tiếp cận điểm đặt máy chủ đủ cạnh tranh. Vấn đề khoảng cách đến công cụ giao dịch đưa chúng ta đến một khía cạnh quan trọng khác

Một trong những vấn đề cốt lõi của giao dịch ngày nay, đặc biệt là trên thị trường chứng khoán Mỹ, chính là sự phân mảnh, mà chúng ta sẽ thảo luận chi tiết hơn trong Phần 3.6. Một nhà giao dịch trên thị trường chứng khoán Mỹ cần lưu ý rằng có tới 13 sàn giao dịch điện tử (light) và hơn 40 sàn giao dịch điện tử (dark). Cùng với phạm vi rộng lớn của các lựa chọn giao dịch này, còn có các quy định cụ thể (còn gọi là quy tắc "giao dịch xuyên suốt") ảnh hưởng đến việc các lệnh thị trường được gửi đến một sàn giao dịch nếu có giá thực hiện tốt hơn tại các sàn giao dịch khác. Sự tương tác của nhiều sàn giao dịch, độ trễ khi di chuyển giữa các sàn giao dịch này và các quy định bổ sung tạo ra những khía cạnh cần lưu ý khi thiết kế các chiến lược giao dịch thành công.

1.3.4 Các loại lệnh mở rộng

Vai trò của thời gian là nền tảng trong các sàn giao dịch điện tử ưu tiên giá-thời gian thông thường, và trong một thị trường phân mảnh, vấn đề này càng trở nên quan trọng hơn. Các nhà giao dịch cần có khả năng điều chỉnh vị thế giao dịch của mình nhanh chóng để ứng phó hoặc dự đoán những thay đổi của thị trường, không chỉ tại sàn giao dịch địa phương mà còn ở các thị trường khác. Cuộc đua để trở thành người đầu tiên vào hoặc thoát khỏi một vị thế nhất định là một trong những điểm nhấn của cuộc tranh luận về lợi ích và chi phí của giao dịch tần suất cao. Tầm quan trọng của tốc độ thấm nhuần toàn bộ quá trình thiết kế giao dịch.

Thuật toán, từ mã lệnh thực tế, đến lựa chọn ngôn ngữ lập trình, phần cứng được triển khai, đặc điểm kết nối với công cụ khớp lệnh, và cách thức định tuyến lệnh trong một sàn giao dịch và giữa các sàn giao dịch. Nhận thức được tầm quan trọng của tốc độ, các sàn giao dịch đã thích nghi và, trong số những yếu tố khác, đã vượt xa hai loại lệnh cơ bản (MO và LO). Bất kỳ nhà giao dịch nào cũng nên nắm rõ tất cả các loại lệnh khác nhau có sẵn trên sàn giao dịch, chúng là gì và cách sử dụng chúng. Một số ví dụ về các loại lệnh bạn có thể tìm thấy là:

Lệnh trong ngày: lệnh giao dịch trong quá trình giao dịch thông thường với tùy chọn mở rộng sang các phiên giao dịch trước hoặc sau thị trường - Lệnh không định tuyến: có một số lệnh được lựa chọn hoặc thiết kế để tránh việc định tuyến lại mặc định sang các sàn giao dịch khác, chẳng hạn như ^chỉ sổ', *chỉ sau”, chốt giữa, .... - Chốt, Ẩn không Trượt: lệnh di chuyển theo điểm giữa hoặc giá tốt nhất quốc gia;

-Ẩn: lệnh không hiển thị số lượng -Tảng băng trôi: lệnh chỉ hiển thị một phần số lượng (một số lệnh có tùy chọn tự động bổ sung phần hiển thị khi số lượng lệnh giảm xuống dưới một lô); -Ngay lập tức hoặc hủy: lệnh được thực hiện nhiều nhất có thể ở mức giá tốt nhất và phần còn lại bị hủy (các lệnh này không được chuyển hướng sang sàn giao dịch khác cũng như không được kiểm soát) -Hoàn tất hoặc hủy: lệnh được gửi đi để thực hiện toàn bộ hoặc không thực hiện ở mức giá tốt nhất; -Thời hạn hiệu lực: lệnh có thời hạn cố định để hủy nếu không được thực hiện trước thời hạn; -Tùy ý: lệnh hiển thị một mức giá (giá giới hạn) nhưng có thể được thực hiện ở mức giá cạnh tranh hơn (ẩn)

và còn vô số những biến thể khác của MO và LO cổ điển.

Khi lập trình một thuật toán, người ta cần phải rất lưu ý đến tất cả các loại lệnh có thể được phép, không chỉ trên một sàn giao dịch, mà trên tất cả các sàn giao dịch cạnh tranh nơi tài sản quan tâm của người ta được giao dịch. Việc không nắm rõ về sự đa dạng của các loại lệnh có thể dẫn đến tổn thất đáng kể. Vì một số loại lệnh này cho phép thay đổi và điều chỉnh ở cấp độ công cụ giao dịch, nên chúng không thể bị đánh bại về độ trễ bởi công cụ của nhà giao dịch, bất kể thuật toán của bạn được lập trình và thiết lập cứng hiệu quả đến đâu.1 Sau này, khi phát triển các thuật toán toán học trong Phần III của cuốn sách, chúng tôi giả định rằng các tác nhân sử dụng MO và LO, và khi LO bị hủy, việc này được thực hiện hoàn toàn.

1.3.5 Phí trao đổi

Một vấn đề quan trọng khác cần lưu ý là giao dịch trên sàn giao dịch không miễn phí, nhưng chi phí cũng không giống nhau đối với tất cả các nhà giao dịch. Ví dụ, nhiều sàn giao dịch áp dụng hệ thống phí maker-taker, theo đó nhà giao dịch gửi lệnh MO (và do đó lấy đi thanh khoản khỏi thị trường) phải trả phí giao dịch, trong khi nhà giao dịch có lệnh LO được khớp với lệnh MO (tức là lệnh LO khớp với lệnh MO) sẽ phải trả phí giao dịch thấp hơn nhiều, hoặc thậm chí nhận được khoản thanh toán (hoàn tiền) từ sàn giao dịch vì đã cung cấp thanh khoản (tạo ra thị trường). Mặt khác, có những thị trường có biểu phí đảo ngược, hệ thống taker-maker, trong đó cấu trúc phí ngược lại: những người cung cấp thanh khoản phải trả phí cao hơn những người lấy thanh khoản (thậm chí có thể được hoàn tiền). Vấn đề phí giao dịch khá quan trọng vì phí làm sai lệch giá thị trường được quan sát (khi bạn thực hiện giao dịch, giá liên quan đối với bạn là giá ròng bạn trả/nhận,

(là giá công bố sau khi trừ phí) và tác động của chúng trong một thị trường phân mảnh đang được tranh luận mạnh mẽ.2

1.4

Sổ lệnh giới hạn

Sau khi thấy mọi thứ có thể phức tạp đến mức nào, chúng ta hãy bắt đầu từ mô tả cơ bản nhất về LOB và minh họa nó trước tiên bằng cách sử dụng một LOB nhân tạo, và sau đó (Hình 1.4) bằng một số ví dụ thực tế, sử dụng dữ liệu tin nhắn chi tiết từ hai tài sản, HPQ và FARO, trên sàn giao dịch chứng khoán NASDAQ. Thêm LO vào LOB. Như đã đề cập ở trên, các sàn giao dịch điện tử, tại

cơ bản nhất của chúng, được mô tả bằng một LOB và một thuật toán khớp lệnh. Chúng ta đã thảo luận về cách thức hoạt động của nguyên tắc ưu tiên giá-thời gian: một LOB đến tham gia vào LOB tại mức giá của lệnh và được xếp cuối cùng trong hàng đợi thực hiện tại mức giá đó. Điều này được minh họa trong một LOB nhân tạo, trong Hình 1.2. Trong hình này, các LOB được hiển thị dưới dạng các khối có độ dài bằng với số lượng của chúng. Các LOB được sắp xếp theo thứ tự ưu tiên thời gian từ phải sang trái, do đó, khi một LO mua mới xuất hiện với giá 23,09 đô la (khối màu tím ở bảng dưới cùng của Hình 1.2), nó sẽ được thêm vào hàng các khối đang nằm ở mức giá đó. LO mới này tham gia vào hàng đợi tại điểm gần trục y nhất, trở thành LO thứ ba đang chờ được thực hiện tại mức 23,09 đô la. MO sẽ đi qua LOB hoặc được định tuyến lại. Giả sử chúng ta đang xem xét địa điểm

với LOB được mô tả ở đầu Hình 1.2. Giả sử rằng địa điểm tốt nhất này

Hình 1.3 Minh họa LOB về MO bán đi trên LOB có và không có định tuyến lại

Giá bid là giá mua tốt nhất mà thị trường hiện đang hiển thị trên tất cả các sàn giao dịch. Một lệnh MO (bán) 250 cổ phiếu mới được đưa vào thị trường này, được mô tả bằng tổng các ô màu xanh lá cây ở ô trên cùng của Hình 1.3. Hệ thống khớp lệnh sẽ đi qua LOB, khớp các lệnh LO hiện có (đã được niêm yết) (mua ở phía bid) với MO đang tham gia theo các quy tắc của thuật toán khớp lệnh. Trong LOB, có hai lệnh LO với giá bid tốt nhất là 23,09 đô la, được biểu thị bằng hai ô màu đỏ, mỗi ô có 100 đơn vị, tổng cộng là 200 đơn vị. 200 đơn vị này được khớp lệnh với giá bid tốt nhất. 50 đơn vị còn lại sẽ được khớp lệnh tùy thuộc vào loại lệnh và diễn biến thị trường.

Nó đang hoạt động. Trong một thị trường tiêu chuẩn, 50 đơn vị còn lại sẽ được thực hiện dựa trên các lệnh LOB có giá trị 23,08 đô la được sắp xếp theo thứ tự ưu tiên thời gian (MO sẽ thực hiện theo sổ lệnh). Điều này được thể hiện trong các bảng trên cùng của Hình 1.3: bảng bên trái cho thấy lệnh MO đến được chia thành ba khối, hai khối đầu tiên được khớp với các lệnh LOB có giá trị 23,09 đô la và khối cuối cùng được khớp với các lệnh LOB có giá trị 23,08 đô la. Sau khi lệnh MO được thực hiện hoàn toàn, các lệnh LOB còn lại được hiển thị ở bảng trên cùng bên phải của Hình 1.3. Như đã đề cập trong tiểu mục 1.3.3, tại Hoa Kỳ, có các lệnh bảo vệ.

Các quy tắc để đảm bảo các lệnh MO được thực hiện tốt nhất có thể, và (tùy thuộc vào loại lệnh) có thể yêu cầu sàn giao dịch chuyển hướng 50 đơn vị còn lại sang một sàn giao dịch khác cũng đang hiển thị giá chào mua tốt nhất là 23,09 đô la. Trong trường hợp này, như được hiển thị trong bảng dưới cùng bên trái của Hình 1.3, một phần trong 50 đơn vị còn lại (khối màu xanh nhạt) được chuyển hướng sang một hoặc nhiều địa điểm khác với thanh khoản được niêm yết ở mức 23,09 đô la. Chỉ khi toàn bộ thanh khoản ở mức 23,09 đô la trên tất cả các sàn giao dịch đã cạn kiệt, thì

Các cổ phiếu còn lại của MO sẽ được trả lại và được thực hiện tại địa điểm này đối với bất kỳ LO nào có giá (mức giá tệ hơn) là 23,08 đô la. Trong ví dụ này, 25 đơn vị đã được chuyển hướng sang các sàn giao dịch thay thế và 25 đơn vị đã được trả lại địa điểm này và thực hiện theo sổ sách.

Về nguyên tắc, MO có thể là lệnh Ngay lập tức hoặc Hủy (IOC), trong đó nêu rõ rằng 50 cổ phiếu còn lại không thể thực hiện được ở mức giá thầu tốt nhất sẽ bị hủy hoàn toàn.

Do các quy tắc bảo vệ lệnh này (quy tắc giao dịch xuyên suốt - không có quy tắc nào như vậy ở thị trường châu Âu), bạn sẽ rất hiếm khi thấy một lệnh MO (lệnh bán) được thực hiện ngay lập tức tại Hoa Kỳ. Thay vào đó, bạn có thể thấy một lệnh MO lớn được chia nhỏ và thực hiện tuần tự trên nhiều thị trường trong một khoảng thời gian rất ngắn. Điều này cũng ngụ ý rằng khi độ sâu biến mất (như trong vụ Sụp đổ Flash ngày 6 tháng 5 năm 2010), một lệnh MO ở cuối chuỗi các lệnh khác có thể được thực hiện với mức giá rất thấp, và trong trường hợp xấu nhất, nó có thể được khớp với các lệnh LO (lệnh bán) được niêm yết với mức giá vô lý đến mức rõ ràng cho thấy chúng không được mong đợi sẽ được thực hiện (những giao dịch như vậy đã được quan sát thấy trong vụ Sụp đổ Flash ở các tài sản sau: JKE, RSP, Excelon, Accenture, v.v.). Do đó, LOB có chức năng theo dõi các lệnh LO và áp dụng thuật toán khớp các lệnh đến với các lệnh LO hiện có. LOB được xác định trên một lưới giá rời rạc cố định (các mức giá).

Kích thước của bước nhảy (chênh lệch giữa một mức giá này và mức giá tiếp theo) được gọi là tick, và tại Hoa Kỳ, kích thước tick tối thiểu là 1 xu cho tất cả các cổ phiếu có giá trên một đô la. Tại các thị trường khác, kích thước tick khác nhau tồn tại song song. Ví dụ, tại Sở Giao dịch Chứng khoán Paris hoặc Sở Giao dịch Chứng khoán Bolsa de Madrid, kích thước tick có thể dao động từ 0,001 đến 0,05 euro tùy thuộc vào giá cổ phiếu đang giao dịch. Hình 1.1 cho thấy một biểu đồ mẫu của sổ lệnh giới hạn (LOB) trên NASDAQ

Sau sự kiện thứ 10.000 trong ngày của hai cổ phiếu FARO và HPQ, vào ngày 1 tháng 10 năm 2013. Màu xanh lam cho thấy các nhà giao dịch bán LOs sẵn sàng chờ đợi để có thể bán với giá cao. Giá bán tốt nhất, giá chào bán, là 21,16 đô la, trong khi giá mua tốt nhất, giá chào mua, là 21,15 đô la. Chênh lệch giữa giá chào bán và giá chào mua, hay còn gọi là chênh lệch giá được niêm yết, là

$$\mathrm{Trích dẫn~Lây lan}_t=P_t^a-P_t^b:,$$

(trong đó $P_{t}^{b}$ và $P_{t}^{\alpha}$ là giá mua và giá bán tốt nhất), trong trường hợp này, chênh lệch giá tối thiểu được niêm yết là 1 xu. Tuy nhiên, đôi khi giá mua bằng giá bán và chênh lệch giá bằng 0. Trong trường hợp đó, thị trường bị khóa, nhưng nếu điều này xảy ra, nó thường không kéo dài mặc dù đối với một số tài sản rất thanh khoản, nó đang ngày càng trở nên thường xuyên hơn. Một khái niệm phổ biến khác được sử dụng khi mô tả LOB là giá trung bình. Giá trung bình là trung bình số học của giá mua và giá bán:

$$\mathrm{Giá trung bình}_t=\frac{1}{2}(P_t^a+P_t^b):.$$

Nó thường được sử dụng để đại diện cho giá cơ bản thực sự của tài sản - giá của tài sản nếu không có chi phí giao dịch rõ ràng hoặc ngầm định (và do đó không có chênh lệch). Như đã chỉ ra trước đó, hai LOB được hiển thị trong Hình l.1 khá khác nhau.

Hình 1.4 Chuỗi thời gian thay đổi LOB của ba tài sản HPQ NTAP và ORCL

HPQ 1 tháng 10 năm 2013 10:40:00.000 đến 10:45:00.000

NTAP ngày 1 tháng 10 năm 2013

11:30:00.000 đến 11:35:00.000

ORCL ngày 1 tháng 10 năm 2013

Biểu đồ ở bảng bên trái tương ứng với HPQ, một tài sản được giao dịch thường xuyên và thanh khoản cao. LOB của HPQ có các LOB được niêm yết tại mỗi tick, cách giá trung bình ít nhất 20 tick, và mức chênh lệch là mức chênh lệch tối thiểu là 1 tick. Ở bảng bên phải, chúng ta có LOB của FARO. FARO là một tài sản ít được giao dịch và kém thanh khoản. Tài sản này có các lệnh mua và bán được niêm yết thưa thớt và các khoảng trống không đều trong LOB. Mức chênh lệch là 20 tick (20 xu) cho một tài sản có giá (khoảng) $41. Sự khác biệt về thanh khoản giữa các tài sản này cũng đáng chú ý từ thời điểm sự kiện thứ 10.000 trong ngày diễn ra đối với các tài sản này. Đối với HPQ, sự kiện thứ 10.000 tương ứng với dấu thời gian khoảng 9 giờ 42 phút sáng (ít hơn 15 phút sau khi thị trường mở cửa), trong khi đối với FARO, sự kiện thứ 10.000 không xảy ra cho đến khoảng 12 giờ 04 phút chiều (hơn hai tiếng rưỡi sau khi thị trường mở cửa). Cũng lưu ý rằng có ít hơn 100 đơn vị được niêm yết nếu chúng ta cộng tổng độ sâu ở hai mức giá tốt nhất trên giá mua và giá bán của FARO, trong khi đối với HPQ, có hơn 1.000 cổ phiếu được chào bán ở hai mức giá đầu tiên của LOB do đó HPQ có độ sâu lớn hơn nhiều. Nếu tính đến việc FARO được giao dịch ở mức giá cao gấp đôi giá của HPQ, thì độ sâu về giá trị đô la của cổ phiếu được niêm yết ở những mức giá đó cũng lớn hơn nhiều đối với HPQ. Ảnh chụp nhanh được hiển thị trong Hình 1.1 chỉ minh họa một phiên bản tĩnh của LOB;

tuy nhiên, động lực của nó khá thú vị và bổ ích. Trong Hình 1.4, chúng tôi trình bày cách LOB diễn biến theo thời gian (trên 5 phút) đối với ba cổ phiếu khác nhau, HPQ, NTAP và ORCL. Trên trục z là thời gian tính bằng phút, và trên trục y là giá tính bằng đô la. Hình ảnh tĩnh mà chúng ta thấy trong Hình 1.1 được thể hiện bằng

Các vùng màu xanh lam và đỏ được tô bóng. Các vùng màu xanh lam ở trên cùng thể hiện phía bán của LOB, tức khối lượng bán đã đăng, trong khi phía mua được tô màu đỏ ở bên dưới, thể hiện khối lượng mua đã đăng. Mức giá tốt nhất, giá mua và giá bán được xác định bằng các cạnh của vùng màu be nhạt trung gian được tô bóng, biểu thị chênh lệch giá mua-bán. Khối lượng tại mỗi mức giá, được thể hiện trong Hình 1.1 bằng các thanh ngang, giờ được minh họa bằng kích thước của vùng tô bóng ngay phía trên/dưới mỗi mức giá, mặc dù chiều cao của các vùng này không còn tuyến tính nữa mà là một phép biến đổi phi tuyến tính đơn điệu, minh họa trực quan hơn. Ngoài ra, Hình 1.4 xác định thời điểm các lệnh đến được thực hiện.

Các vòng tròn đỏ/xanh biểu thị thời gian, giá và kích thước (được biểu thị bằng kích thước của vòng tròn) của một MO tích cực được thực hiện đối với các LO nằm trong LOB. Khi một MO bán được thực hiện đối với một LO mua, nó được gọi là chạm giá thầu; tương tự, khi một MO mua được thực hiện đối với một LO bán, nó được gọi là nâng giá thầu. Đường liền màu nâu mô tả một biến thể của tài sản được gọi là microprice được định nghĩa là a8 $$\mathrm{Giá siêu nhỏ}{t}=\frac{V{t}^{b}}{V_{t}^{b}+V_{t}^{a}}:P_{t}^{a}+\frac{V_{t}^{a}}{V_{t}^{b}+V_{t}^{a}}:P_{t}^{b}:,$$

trong đó $V_{t}^{rb}$ và $V_{t}^{\mathrm{r}}$ là khối lượng được niêm yết ở mức giá mua và bán tốt nhất, và $P_{t}^{b}$ và $P_{t}^{\mathrm{on}}$ là giá mua và giá bán. Giá vi mô được sử dụng như một đại diện tinh tế hơn cho giá không mất phí giao dịch của tài sản, vì nó đo lường xu hướng giá phải di chuyển về phía giá mua hoặc giá bán được thể hiện qua số lượng cổ phiếu được niêm yết, và do đó chỉ ra áp lực mua (bán) trên thị trường. Nếu có nhiều người mua (người bán), thì giá vi mô sẽ được đẩy về phía giá bán/giá mua tốt nhất để phản ánh khả năng giá sẽ tăng (giảm). Chúng tôi sẽ tìm hiểu sâu hơn về giá vi mô và tác động của khối lượng tương đối lên giá mua và giá bán trong Chương 12 khi phát triển các thuật toán có tính đến sự mất cân bằng khối lượng trong LOB.

1.5 Tài liệu tham khảo và bài đọc chọn lọc

O'Hara (1995), de Jong & Rindi (2009), Lehalle (2009), Colliard & Foucault (2012), Abergel, Anane, Chakraborti, Jedidi & Toke (2015)

Sơ lược về cấu trúc vi mô của 2 thị trường tài chính

Để hiểu được các vấn đề và khó khăn gặp phải trong quá trình thiết kế và triển khai chiến lược giao dịch, chúng ta phải xem xét các yếu tố kinh tế thúc đẩy các chiến lược giao dịch này. Để làm điều này, chúng ta tham khảo các tài liệu về cấu trúc vi mô thị trường. Phần 2.1 xem xét mô hình tạo lập thị trường cơ bản, tập trung vào hàng tồn kho và rủi ro hàng tồn kho, cũng như sự đánh đổi giữa tần suất thực hiện lệnh và lợi nhuận trên mỗi giao dịch. Phần này cũng xem xét cơ sở khái niệm cho các thước đo thanh khoản cơ bản. Hai phần cuối xem xét giao dịch khi có sự khác biệt về thông tin giữa các nhà giao dịch. Phần 2.2 từ góc nhìn của nhà giao dịch có nhiều thông tin hơn, và Phần 2.3 từ góc nhìn của nhà tạo lập thị trường ít thông tin hơn.

Đối với kinh tế học giao dịch, chúng tôi xem xét cấu trúc vi mô thị trường, vì đây là phân ngành của tài chính tập trung vào cách thức giao dịch diễn ra trong những bối cảnh rất cụ thể: nó “là nghiên cứu về quy trình và kết quả của việc trao đổi tài sản theo các quy tắc giao dịch rõ ràng” (O'Hara (1995)). Do đó, nó bao hàm chủ đề của cuốn sách này, giao dịch thuật toán và giao dịch tần suất cao. Chính trong các tài liệu về cấu trúc vi mô, chúng tôi tìm thấy các nghiên cứu về quy trình trao đổi tài sản: chiến lược giao dịch và kết quả của chúng: giá tài sản, khối lượng, chuyển giao rủi ro, v.v.

Một khía cạnh quan trọng của quá trình giao dịch và thiết lập giá là thông tin. Ai có thông tin gì, thông tin đó ảnh hưởng như thế nào đến các chiến lược giao dịch, và những chiến lược giao dịch đó ảnh hưởng như thế nào đến kết quả giao dịch nói chung, và giá tài sản nói riêng. Bốn mươi năm trước, lý thuyết tài chính đã giới thiệu các công cụ để kết hợp và đánh giá rõ ràng khái niệm hiệu quả giá, ý tưởng cho rằng "giá thị trường là một cách hiệu quả để truyền tải thông tin cần thiết để đạt được sự phân bổ nguồn lực tối ưu Pareto" (Grossman & Stiglitz (1976)). Khía cạnh này tự nhiên xuất hiện trong các nghiên cứu về cấu trúc vi mô, xem xét chi tiết cách các quy tắc giao dịch và điều kiện giao dịch khác nhau kết hợp hoặc cản trở hiệu quả giá. Điểm khác biệt giữa các nghiên cứu về cấu trúc vi mô với các nghiên cứu định giá tài sản tổng quát hơn là chúng tập trung vào hai khía cạnh then chốt đối với thanh khoản giao dịch và khám phá giá, và đây là hai khía cạnh chính thúc đẩy các câu hỏi và vấn đề đằng sau việc thiết kế giao dịch thuật toán và giao dịch tần suất cao hiệu quả.1 Giao dịch có thể diễn ra theo một số cách có thể: thông qua các giao dịch cá nhân được thanh toán

qua một cái bắt tay trong câu lạc bộ, thông qua các phòng chat phi tập trung nơi các nhà giao dịch tham gia

với nhau trong các giao dịch cá nhân song phương, thông qua các giao dịch OTC do môi giới trung gian, thông qua các mạng lưới môi giới-đại lý chuyên biệt, trên các thị trường điện tử mở, v.v. Trọng tâm của chúng tôi là giao dịch và các thuật toán giao dịch diễn ra trên các thị trường điện tử lớn, cho dù đó là các sàn giao dịch mở, chẳng hạn như thị trường chứng khoán NASDAQ, hay trên các sàn giao dịch điện tử tư nhân (do một nhà môi giới-đại lý, một ngân hàng hoặc một tập đoàn các nhà đầu tư bên mua điều hành)

2.1 Tạo lập thị trường

Như đã thấy trong Chương 1, một loại hình tham gia thị trường quan trọng là nhà tạo lập thị trường thụ động (MM), người tạo điều kiện cho giao dịch và lợi nhuận từ việc tạo ra chênh lệch giá và kỹ năng thực hiện lệnh, đồng thời phải nhanh chóng thích ứng với những thay đổi của thị trường. Một loại hình khác là nhà giao dịch "chủ động", người tận dụng khả năng dự đoán biến động giá và phải xác định thời điểm tối ưu để can thiệp vào thị trường. Chúng ta hãy bắt đầu với nhóm đầu tiên, những nhà giao dịch "thụ động".

Vì chúng tôi tập trung vào giao dịch trên các sàn giao dịch năng động, nên việc giả định rằng có nhiều nhà tạo lập thị trường (MM) cạnh tranh là điều dễ hiểu. Việc giao dịch trên một thị trường do một vài MM chi phối đương nhiên cần phải xem xét thêm cách các MM thực thi quyền lực thị trường của họ và cách thức điều này ảnh hưởng đến toàn bộ thị trường.

Các MM đóng vai trò quan trọng trên thị trường, nơi họ chịu trách nhiệm cung cấp thanh khoản cho những người tham gia thị trường bằng cách báo giá mua và bán các tài sản đang được giao dịch, cho dù đó là cổ phiếu, sản phẩm tài chính phái sinh, hàng hóa, tiền tệ hay các loại tài sản khác. Một khía cạnh quan trọng của thanh khoản do MM cung cấp là tính tức thời: khả năng nhà đầu tư mua (hoặc bán) một tài sản tại một thời điểm cụ thể mà không cần phải chờ đợi để tìm một đối tác có vị thế bù trừ để bán (hoặc mua). Bằng cách báo giá mua và bán (hoặc niêm yết lệnh giới hạn (LO) ở cả hai mặt của sổ), MM sẵn sàng cung cấp thanh khoản cho thị trường, nhưng để biến điều này thành một hoạt động kinh doanh bền vững, MM báo giá mua thấp hơn giá bán được niêm yết của mình. Ví dụ, một MM sẵn sàng mua cổ phiếu của công ty XYZ với giá 99 đô la và sẵn sàng bán với giá 101 đô la cho mỗi cổ phiếu. Lưu ý rằng bằng cách niêm yết LO, MM đang cung cấp thanh khoản cho các nhà giao dịch khác, những người có thể muốn thực hiện giao dịch nhanh chóng, ví dụ bằng cách nhập lệnh thị trường (MO). Do đó, chúng ta có sự phân đôi thông thường tách biệt các MM với tư cách là nhà cung cấp thanh khoản khỏi các nhà giao dịch khác, được coi là người nhận thanh khoản. Nếu MM của chúng ta là người đưa ra mức giá tốt nhất, thì giá chào bán là $$101$ và

Giá thầu $99, thì chênh lệch giá được báo giá là $$2. Có một số lý thuyết giải thích yếu tố quyết định chênh lệch giá trong một thị trường cạnh tranh. Trước khi đi sâu vào một số lý thuyết này, chúng ta hãy xem xét những vấn đề mà người muốn cung cấp thanh khoản phải đối mặt.

Vấn đề đầu tiên mà một MM phải đối mặt khi cung cấp thanh khoản là bằng cách chấp nhận một bên của giao dịch (ví dụ mua từ một người muốn bán), MM sẽ nắm giữ tài sản trong một khoảng thời gian không xác định, khoảng thời gian cần thiết để một người khác tham gia thị trường với nhu cầu thanh khoản tương ứng (muốn mua tài sản mà MM đã mua trong giao dịch trước đó). Trong thời gian đó, MM phải chịu rủi ro giá biến động bất lợi (trong ví dụ của chúng ta, khi MM mua tài sản, cô ấy phải chịu rủi ro giá giảm và do đó phải bán tài sản với giá lỗ trong giao dịch tiếp theo). Cần nhớ rằng MM không có nhu cầu hoặc mong muốn nội tại nào trong việc nắm giữ bất kỳ hàng tồn kho nào, vì vậy

Grossman & Miller (1988) cung cấp một mô hình giải quyết vấn đề này và mô tả cách các MM nhận được mức phí thanh khoản từ các nhà giao dịch thanh khoản, bù đắp chính xác cho rủi ro giá của việc nắm giữ tài sản cho đến khi họ có thể bán nó cho một nhà giao dịch thanh khoản khác.

Chúng ta hãy xem xét một phiên bản đơn giản hóa của mô hình của họ, với một số hữu hạn, $7t$, các MM giống hệt nhau cho một số tài sản nhất định và ba ngày $t\in{1,2,3}$ Để đơn giản hóa tình huống, không có sự không chắc chắn nào về sự xuất hiện của các lệnh khớp lệnh: nếu tại ngày $t=1$, một nhà giao dịch thanh khoản, được ký hiệu là LTl, đến thị trường để bán $i$ đơn vị tài sản, thì sẽ (chắc chắn) có một nhà giao dịch thanh khoản khác (LT2) sẽ đến thị trường để mua $i$ đơn vị (hoặc tổng quát hơn, để giao dịch $-i$ đơn vị, do đó giao dịch của LT1 (của $\dot{i}$ đơn vị) có thể là âm hoặc dương (LT1 có thể mua hoặc bán). Tuy nhiên, LT2 không đến thị trường cho đến khi $t=2$. Giả sử tất cả các tác nhân bắt đầu với số tiền mặt ban đầu bằng $W_{0}$, các MM không nắm giữ tài sản nào, LT1 nắm giữ $\dot{x}$ đơn vị và LT2 $-\bar{i}$ đơn vị. Không có chi phí giao dịch hoặc chi phí trực tiếp để lưu giữ hàng tồn kho. Trọng tâm là

thay đổi giá: tài sản sẽ có giá trị tiền mặt tại $t=3$ của $S_{3}=\mu+\epsilon_{2}+\epsilon_{3}$ trong đó $\mu$ là hằng số, $E2$ và $\mathbf{e}3$ là các biến ngẫu nhiên độc lập, phân phối chuẩn với trung bình bằng không và phương sai $\sigma^{2}$. Các biến này sẽ được công bố công khai trong khoảng thời gian từ $t-1$ đến $t$, tức là $e3$ được công bố trong khoảng thời gian từ $t=2$ đến $t=3$, và $e2$ được công bố trong khoảng thời gian từ $t=1$ đến $t=2$. Do đó, giá trị tiền mặt thực tế của tài sản có thể tăng hoặc giảm (bỏ qua thực tế là có các khoản thực tế của $e2$ và $E3$ có thể khiến giá trị tài sản âm, mô hình này dùng để minh họa một điểm). Vì các cú sốc đối với giá trị của tài sản trung bình bằng không nên nhà giao dịch trung lập với rủi ro không phải chịu bất kỳ chi phí nào khi nắm giữ tài sản. Mô hình trở nên thú vị nếu chúng ta giả định rằng tất cả các nhà giao dịch, MM và nhà giao dịch thanh khoản, đều e ngại rủi ro. Cụ thể hơn, giả sử họ có tiện ích kỳ vọng sau cho giá trị tiền mặt ngẫu nhiên trong tương lai của tài sản X3: $X_{3}$ $(X_{3})\colon\mathbb{E}\left[U\left(X_{3}\right)\right]$ trong đó $U\left(X\right)=-\exp\left(-\gamma X\right)$ và $\gamma>0$ là tham số thể hiện mức phạt tiện ích khi chấp nhận rủi ro (tham số e ngại rủi ro). Giải ngược mô hình, ta thu được mô tả về hành vi giao dịch và

giá. Tại $t=3$ giá trị tiền mặt của tài sản được hiện thực hóa, $S_{3}=\mu+\epsilon_{2}+\epsilon_{3}$ . Tại $t=2$, $7L$ MMs và LT1 bước vào kỳ với lượng tài sản nắm giữ $q_{1}^{MM}$ và $q_{1}^{LT1}$

tương ứng. LT2 tham gia với $-\dot{i}$ và tất cả đều thoát ra với lượng tài sản nắm giữ $q_2^j$, trong đó $j\in{MM,LT1,LT2}$. Lưu ý rằng nếu, ví dụ, $q_t^j=2$, điều này biểu thị rằng tác nhân $j$ đang nắm giữ 2 đơn vị khi thoát khỏi ngày $t$, do đó tác nhân sẽ ở trạng thái mua (tức là có hàng tồn kho) hai đơn vị. Với bài toán đã mô tả cho đến nay, tại $t=2$, tác nhân $j$ chọn $q_2^j$ để tối đa hóa tiện ích kỳ vọng của mình khi biết được giá trị thực tế của $e_{r}2$ đã được công khai trước $t=2$

$$\max_{q_2^j}\mathbb{E}\left[U\left(X_3^j\right)\mid\epsilon_2\right]$$

tùy thuộc vào

$$X_3^j=X_2^j+q_2^j:S_3,\quad X_2^j+q_2^j:S_2=X_1^j+q_1^j:S_2:.$$

Hai ràng buộc này nắm bắt:

(i) thực tế là giá trị tiền mặt của tài sản của đại lý tại $t=3$ ， $X_{3}$ , bằng với số tiền mặt mà đại lý nắm giữ tại $t=3$ , bằng với $X_{2}$ cộng với giá trị tiền mặt của hàng tồn kho tài sản của đại lý $q_2^j$ , và

(ii) thực tế là giá trị tiền mặt của tài sản của đại lý khi thoát khỏi ngày $t=2$ ： $X_{2}$ và hàng tồn kho $q_2^j$ ) bằng giá trị tiền mặt của tài sản của đại lý khi nhập ngày $t=2$ $X_{1}$ , và hàng tồn kho $q_{1}^{\bar{j}}$ ).

Với giả định về tính chuẩn và các đặc tính của hàm tiện ích kỳ vọng, có thể dễ dàng chứng minh rằng

$$\mathbb{E}\left[U\left(X_3^j\right)\mid\epsilon_2\right]=-\exp\left{-\gamma\left(X_2^j+q_2^j\mathbb{E}[S_3\mid\epsilon_2]\right)+\frac{1}{2}\gamma^2\left(q_2^j\right)^2\sigma^2\right}:.$$

Do đó, vấn đề là lõm và giải pháp được đặc trưng bởi

$$q_2^{j,*}=\frac{\mathbb{E}[S_3\mid\epsilon_2]-S_2}{\gamma\sigma^2}:,$$

cho tất cả các tác nhân: 71 MM, LT1 và LT2

Tại thời điểm $t=2$, cung và cầu đối với tài sản phải bằng nhau, chúng ta có thể giải quyết để tìm giá cân bằng $S_{2}$

$$n:q_1^{MM}+q_1^{LT1}+q_1^{LT2}=n:q_2^{MM}+q_2^{LT1}+q_2^{LT2}:,$$

trong đó chúng ta sử dụng quy ước rằng $q_{1}^{LI2}$, tài sản mà LT2 đạt được trong giai đoạn 2, bằng với giao dịch mong muốn của anh ta, $-i$. Như chúng ta đã thiết lập ở trên, tất cả $q_{2}^{j}$ đều bằng nhau nên vế phải của phương trình trên bằng

$$n:q_{2}^{MM}+q_{2}^{LT1}+q_{2}^{LT2}=(n+2):\frac{\mathbb{E}[S_{3}\mid\epsilon_{2}]-S_{2}}{\gamma\sigma^{2}}:.$$

Chúng tôi cũng biết rằng tại ngày 1, tổng số lượng tài sản có sẵn bằng với số lượng tài sản LT1 đưa ra thị trường, do đó Vế trái của (2.1) là

$$n:q_{1}^{MM}+q_{1}^{LT1}+q_{1}^{LT2}=i+q_{1}^{LT2}=ii=0:.$$

Do đó, thay thế vào (2.2) và giải, ta thu được rằng ở trạng thái cân bằng, tại thời điểm

Hình 2.1 Giao dịch và thiết lập giá trong mô hình Grossman-Miller.

$t=2$ ， $S_2=\mathbb{E}[S_3]=\mu+\epsilon_2+\mathbb{E}[\epsilon_3]=\mu+\epsilon_2$ , và do đó, $q_2^j=0$ . Điều này hợp lý, vì tại $t=2$: không có mất cân bằng tài sản, giá của tài sản phản ánh "giá trị cơ bản (giá hiệu quả)" của nó và không ai muốn nắm giữ một lượng tài sản rủi ro khác không. Phân tích này được thể hiện ở nửa dưới của Hình 2.1, trong đó chúng ta thấy lượng tài sản nắm giữ của ba loại người tham gia khi họ tham gia $t=2$ ， $q_{1}^{j}$ ， $j\in{MM,LT1,LT2}$ , và sau khi giao dịch ở mức giá bằng $S_{2}$, họ kết thúc với lượng tài sản nắm giữ, $q_{2}^{j}$ , bằng không. Bây giờ hãy xem xét điều gì xảy ra tại ngày $t=1$ . Các tác nhân tham gia (74 MM)

và LT1 - nhớ lại rằng LT2 sẽ không xuất hiện cho đến khi $t=2$ ) dự đoán rằng bất kể họ làm gì, giá thị trường tương lai sẽ hiệu quả và họ sẽ kết thúc ngày $t=2$ mà không có hàng tồn kho, do đó $X_{3}=X_{2}$ Do đó, quyết định danh mục đầu tư của họ được đưa ra bởi

$$\max_q\mathbb{E}\left[U\left(X_2^j\right)\right]:,$$

tùy thuộc vào

$$X_2^j=X_1^j+q_1^j:S_1,\quad X_1^j+q_1^j:S_1=X_0^j+q_0^j:S_1:.$$

Lặp lại phân tích $t=2$ tại $t=1$, chúng ta thu được giải pháp danh mục đầu tư tối ưu là

$$q_1^{j,*}=\frac{\mathbb{E}[S_2]-S_1}{\gamma\sigma^2}:,$$

Đối với tất cả các tác nhân, $j$ ， có mặt: 7t MMs và LTl. Ngoài ra, tại thời điểm $t=1$, cung và cầu đối với tài sản phải bằng nhau, do đó

$$n:q_0^{MM}+q_0^{LT1}=n:q_1^{MM}+q_1^{LT1},$$

trong đó $q_{0}^{LT1}=i$ (thực tế là nếu $i>0$, LT1 đang nắm giữ $i$ cổ phiếu mà anh ta muốn bán),

và $q_{0}^{\boldsymbol{M}:\Lambda\boldsymbol{q}}=0$ .Điều này cho chúng ta phương trình sau:

$$i=(n+1):\frac{\mu-S_{1}}{\gamma\sigma^{2}}:\Longleftrightarrow:S_{1}=\mu-\gamma\sigma^{2}\frac{i}{n+1}:.$$

Nửa trên của Hình 2.1 phản ánh cách MM và LT1 tham gia thị trường với lượng tài sản nắm giữ $q_0^3$ và sau khi giao dịch tại $S_{1}$, họ thoát khỏi ngày thứ nhất và tham gia ngày $t=2$ với $q_1^j$

Với biểu thức này, chúng ta có thể diễn giải cách thị trường đạt được giải pháp cho nhu cầu thanh khoản của LT1: LT1, một nhà giao dịch muốn bán tổng cộng $i>0$ đơn vị tại $t=1$ nhận thấy rằng hiện tại không có ai trên thị trường có nhu cầu thanh khoản cân bằng. Có những nhà giao dịch trên thị trường, nhưng họ sẽ không chấp nhận giao dịch ở mức giá hiệu quả là $\mu$ vì nếu họ làm vậy, họ sẽ phải mua vào những cổ phiếu rủi ro (họ phải chịu rủi ro về giá từ việc nhận ra $\mathbf{E}2$ ) mà không được đền bù. Tuy nhiên, nếu họ nhận được khoản đền bù thỏa đáng (mà chúng ta gọi là chiết khấu thanh khoản. đối với $i>0$ ， $S_{1}<\mathbb{E}[S_{2}]=\mu$ ) ， các MM $7t.$ sẽ chấp nhận cổ phiếu của LT1. Tuy nhiên, LT1 nhạy cảm với giá, vì vậy nếu anh ta phải chấp nhận chiết khấu cho cổ phiếu, anh ta sẽ không bán tất cả $i$ cổ phiếu cùng một lúc. Ở trạng thái cân bằng, cả 7L MM và LT1 đều nắm giữ $q_{1}^{j,*}=\frac{2}{n+1}$ đơn vị tài sản, nghĩa là LT1 bán $\frac{n}{n+1}\dot{2}$ đơn vị và giữ lại $\frac{1}{n+1}$ đơn vị để bán sau. Giao dịch diễn ra ở mức giá thấp hơn giá hiệu quả, $S_{1}=\mu-\gamma\sigma^{2}\frac{i}{n+1}$ Chênh lệch giữa giá giao dịch và giá hiệu quả, cụ thể là $|S_{1}-\mu|=\left|\gamma\sigma^{2}\frac{i}{n+1}\right|$ , biểu thị mức chiết khấu (thanh khoản) mà MM nhận được để nắm giữ cổ phiếu của LTl. Quy mô chiết khấu này chịu ảnh hưởng của các biến trong mô hình: quy mô nhu cầu thanh khoản $(|i|)$ ， mức độ cạnh tranh giữa các MM (được thể hiện bởi 72 ), mức độ ngại rủi ro của thị trường $(\gamma.$ ) ）， và rủi ro/biến động của tài sản cơ sở ( $\sigma^{2}$ ). Tất cả các biến này đều ảnh hưởng đến chiết khấu theo cách trực quan: quy mô của cú sốc thanh khoản, mức độ ngại rủi ro và biến động đều làm tăng chiết khấu, trong khi cạnh tranh làm giảm chiết khấu. Điều này xảy ra khi LT1 muốn bán, tức là $i>0.$ Nếu LTl muốn mua, $i<0$ thì giải pháp sẽ giống nhau, ngoại trừ việc thay vì chiết khấu, các MM sẽ nhận được khoản phí bảo hiểm bằng $|S_{1}-\mu|$ trên mỗi cổ phiếu khi bán cho LT1. Từ phân tích này, chúng ta cũng có thể thấy rằng khi cạnh tranh $(n)$ tăng lên, thanh khoản-

phí thanh khoản về 0, giá hội tụ đến mức hiệu quả, $S_{1}=\mu$ và giao dịch ròng ban đầu tối ưu của LT1, $q_{1}^{LT^{\prime}1,*}-q_{0}^{LT1}$ , hội tụ đến nhu cầu thanh khoản của anh ta (i).

2.1.2 Chi phí giao dịch

Chúng ta đã thấy khuôn khổ Grossman & Miller (1988) giúp hiểu cách chi phí nắm giữ tài sản (trong trường hợp này, thông qua sự không chắc chắn mà nó tạo ra cho các MMs ngại rủi ro) ảnh hưởng đến thanh khoản thông qua chi phí giao dịch $(|S_{1}-\mu|)$ và nhu cầu về tính tức thời (tại $t=1$ LT1 chỉ thực hiện $\frac{n}{n+1}^{i}$ thay vì i mong muốn của cô ấy). Ngoài ra, sự cạnh tranh giữa các MMs là rất quan trọng trong việc xác định các chi phí giao dịch này. Nhưng điều gì thúc đẩy TI T $\eta_{b}^{\prime}$? Câu trả lời tự nhiên là 72 được thúc đẩy bởi chi phí giao dịch do các MMs gánh chịu. Trong trường hợp này, chúng ta phải phân biệt giữa sự tham gia

25

chi phí cần có trên thị trường và không phụ thuộc vào hoạt động giao dịch, và chi phí giao dịch phụ thuộc vào hoạt động giao dịch, chẳng hạn như phí giao dịch (mà chúng tôi đã bỏ qua trong phân tích trước đó)

Grossman & Miller (1988) liên kết cạnh tranh, 74, với chi phí tham gia. Họ thực hiện điều này bằng cách giới thiệu một giai đoạn trước đó của mô hình, trong đó các MM tiềm năng quyết định liệu họ có muốn tham gia tích cực vào thị trường và cung cấp thanh khoản hay muốn làm điều gì đó khác. Quyết định này được xác định như một hàm số của tham số chi phí tham gia c, đại diện cho thời gian và khoản đầu tư cần thiết để duy trì sự hiện diện liên tục, năng động và cạnh tranh trên thị trường, cũng như chi phí cơ hội mà MM phải bỏ ra khi tham gia thị trường và không làm điều gì khác. Kết luận, có thể rút ra mà không cần đi sâu vào chi tiết phân tích, là mức độ cạnh tranh giảm dần theo chi phí tham gia của nhà cung cấp. Do đó, chi phí tham gia, được đại diện bởi tham số chi phí $C$, làm tăng quy mô của phí bảo hiểm thanh khoản (thông qua tác động của nó lên cạnh tranh, $TL$). Tham số $C$ thể hiện chi phí cố định khi tham gia thị trường, nhưng

Chúng ta cũng có thể cân nhắc đưa vào mô hình một chi phí giao dịch phụ thuộc vào mức độ hoạt động trên thị trường. Cụ thể, chúng ta đưa vào chi phí giao dịch phụ thuộc vào khối lượng giao dịch, chẳng hạn như phí giao dịch thực tế trên sàn giao dịch. Phí giao dịch trên sàn giao dịch thường tỷ lệ thuận với khối lượng giao dịch tính bằng đô la, nhưng ở đây, để đơn giản, chúng ta sử dụng phí tỷ lệ thuận với số lượng cổ phiếu được giao dịch, được tham số hóa bởi 77. Vì phí đã được biết, các khoản phí này hoạt động như một chi phí tham gia cho các nhà giao dịch thanh khoản. Hiệu ứng đầu tiên của việc $\eta>0$ là các nhà giao dịch thanh khoản với khối lượng giao dịch mong muốn

$(|i|)$ nhỏ so với phí giao dịch, sẽ thấy giao dịch quá tốn kém và không giao dịch (chúng tôi mời độc giả quan tâm tính toán quy mô giao dịch mong muốn tối thiểu $i$ theo hàm của 77). Đối với các giao dịch mong muốn đủ lớn (để giao dịch được tất cả những người tham gia ưa thích hơn là không giao dịch), mô hình cung cấp cho chúng ta giải pháp sau. Giả sử mọi nhà giao dịch trả 77 cho mỗi cổ phiếu bất kể họ mua hay bán tài sản. Để đơn giản hóa, giả sử rằng bất kỳ hàng tồn kho còn lại nào sau $t=2$ đều được thanh lý ở mức $t=3$. Ngoài ra, giả sử LT1 muốn bán $\left|\ddot{\boldsymbol{x}}\right|$ đơn vị ( $i>0$ ), và LT2 muốn mua cùng một lượng (trường hợp ngược lại trông giống nhau nhưng phí giao dịch đi vào vấn đề có dấu ngược lại) Tại $t=2$ ， vì MM và LTl bước vào giai đoạn với hàng tồn kho dương

(và sẽ muốn bán ngay bây giờ hoặc ở $t=3$ ) các khoản nắm giữ cuối kỳ tối ưu của họ là $$q_2^j=\frac{\mathbb{E}[S_3-\eta\mid\epsilon_2]-(S_2-\eta)}{\gamma\sigma^2},\quad j\in{MM,LT1}:,$$

trong khi nhu cầu cổ phiếu của LT2 là

$$q_2^{LT2}=\frac{\mathbb{E}[S_3+\eta\mid\epsilon_2]-(S_2+\eta)}{\gamma\sigma^2}:.$$

Vì mọi người đều dự đoán rằng vị thế giao dịch của họ cần phải được thanh lý dù sao đi nữa, nên phí giao dịch không ảnh hưởng đến giá tại $t=2$ và chúng ta thu được $S_{2}=\mathbb{E}[S_{3}\mid\epsilon_{2}]=$ $\mu+\epsilon_{2}$ (giống như trước đây khi không có phí, $\eta=0$ )

Tại $t=1$, LT1 có vị trí tương tự như tại $t=2$ , vì bất kỳ số lượng nào anh ta không bán ngay bây giờ thì anh ta sẽ phải bán sau, do đó $7f$ biến mất khỏi nghiệm và nguồn cung của anh ta sẽ được đưa ra bởi:

$$q_1^{LT1}=\frac{\mathbb{E}[S_2-\eta]-(S_1-\eta)}{\gamma\sigma^2}:.$$

Mặt khác, các MM dự đoán rằng bất cứ thứ gì họ mua, họ sẽ phải bán sau đó, điều này làm thay đổi hàm cầu tài sản của họ

$$q_1^{MM}=\frac{\mathbb{E}[S_2-\eta]-(S_1+\eta)}{\gamma\sigma^2}:.$$

Điều kiện cân bằng thị trường kết quả hiện nay là

$$i=n:q_{1}^{MM}+q_{1}^{LT1}=\frac{\mu-S_{1}}{\gamma\sigma}+n:\frac{\mu-S_{1}-2\eta}{\gamma\sigma}:.$$

Điều này cho chúng ta phương trình sau:

$$i=(n+1)\xrightarrow{\mu-S_1}-\xrightarrow{2:n:\eta}\iff S_1=\mu-\gamma\quad\frac{i}{n+1}-2\left(\frac{n}{n+1}\right):\eta:,$$

và nhớ lại rằng đối với LT1, $i>0$

Do đó, chúng tôi kết luận rằng sự hiện diện của phí giao dịch tạo ra một khoản chiết khấu thanh khoản bổ sung cho giá ban đầu $S_{1}$. Mô hình cho chúng ta biết rằng hầu hết các khoản phí giao dịch đều do nhà giao dịch thanh khoản khởi tạo giao dịch chi trả: anh ta trả phí giao dịch của riêng mình, $7f$ cho mỗi cổ phiếu, cộng với một phần đáng kể $(n/(n+1)]$ trong số hai khoản phí giao dịch do các MM (2n) chi trả mặc dù gián tiếp, thông qua giá bán thấp hơn, $S_{1}$ thấp hơn. Điều này cũng ảnh hưởng đến tính tức thời mà anh ta nhận được từ thị trường, vì các khoản nắm giữ của anh ta vào cuối $t=1$ không còn là $q_{1}^{LT^{\prime},*}=-i/(n+1)$ nữa mà

$$q_1^{LT1,*}=\frac{i}{n+1}+2\left(\frac{n}{n+1}\right)\frac{\eta}{.}$$

Nếu xem xét cạnh tranh, chúng ta có thể thấy chi phí tham gia và phí có tác động rất khác nhau. Chi phí tham gia được tính trực tiếp thông qua c trong khi phí giao dịch được tính thông qua lợi nhuận kỳ vọng trong tương lai, vốn sẽ thấp hơn vì các MM phải chịu một phần nhỏ phí giao dịch. Cụ thể, với mỗi giao dịch, MM trả 2$\eta$ nhưng thu lại 2$n/(n+1)\eta$ thông qua chiết khấu thanh khoản. Do đó, việc tăng phí giao dịch có tác động nhỏ hơn đến tính thanh khoản thông qua cạnh tranh nhưng lại có tác động trực tiếp lớn hơn đến tính tức thời và chiết khấu thanh khoản.

2.1.3 Đo lường tính thanh khoản

Chúng ta đã thấy trong mô hình Grossman & Miller (1988), chi phí giao dịch, dù là chi phí thiết lập hay phí giao dịch, chủ yếu do các nhà giao dịch thanh khoản chi trả, dù là trực tiếp (dưới dạng phí giao dịch của chính họ) hay ngầm định trong giá (chiết khấu thanh khoản lớn hơn khi bán và phí bảo hiểm lớn hơn khi mua). Giờ đây, chúng ta sẽ xem xét cách những chênh lệch này so với giá "hiệu quả" có thể được quan sát thấy trong các sàn giao dịch điện tử.

Mô hình Grossman & Miller (1988) tránh việc xem xét các chi tiết của

Cơ chế giao dịch bằng cách giải quyết các giá và cầu cân bằng trong bối cảnh kiểu "người đấu giá Walrasian", trong đó tất cả giao dịch diễn ra cùng một lúc và ở một mức giá duy nhất.2 Trên thị trường tài sản điện tử, các quyết định không được đưa ra cùng một lúc, nhưng phân tích cân bằng có thể dễ dàng được diễn giải lại trong bối cảnh thị trường điện tử. Ví dụ, giả sử các nhà giao dịch thanh khoản rất háo hức giao dịch và thực hiện bằng cách gửi lệnh MO (lệnh chờ) lên sàn giao dịch. Khi lệnh của nhà giao dịch thanh khoản được đưa ra thị trường, chúng sẽ đáp ứng các lệnh LO (lệnh chờ) đã được các nhà giao dịch thanh khoản (MM) kiên nhẫn đăng tải và đang nằm trong sổ lệnh giới hạn (LOB). Khi đó, mô hình Grossman-Miller sẽ tương ứng với trình tự sau:

của các sự kiện: khi các MO của LT1 tham gia thị trường, chúng thực hiện theo các LOB trong LOB điều chỉnh theo MO sắp tới. Khi giá thực hiện thay đổi, chiến lược của LT1 cũng thay đổi và cuối cùng, sau khi bán $i:\frac{n}{n+1}$ cổ phiếu, giá đã biến động quá xa và LT1 dừng giao dịch. Nhìn chung, lệnh thị trường của LT1 được thực hiện ở mức giá trung bình là $S_{1}$, hoặc vì nó được gửi dưới dạng một lệnh lớn đi qua LOB (hoặc LOB, nếu lệnh được định tuyến đến nhiều thị trường), hoặc vì nó được chia thành nhiều lệnh nhỏ kích hoạt một động thái dần dần của phía giá thầu trong LOB ra khỏi điểm bắt đầu ban đầu. Sau đó, chiết khấu mà LT1 nhận được là chênh lệch giữa giá trung bình nhận được, $S_{1}$, và giá trung bình ban đầu khi MO đầu tiên tung ra thị trường (là đại diện thông thường cho giá hiệu quả, $\mathbb{E}[S_2]$). Chúng ta có thể viết lại $S_{1}$ dưới dạng hàm tuyến tính của số lượng giao dịch, $q^{LT1}$

$$S_1=\mu+\lambda:q^{LT1},$$

vì vậy trong mô hình Grossman-Miller chúng ta sẽ có

$$\lambda=-\frac{1}{n}:\gamma\sigma^{2},\quad\mathrm{và}\quad q^{LT1}=i:\frac{n}{n+1}:.$$

Tham số $\lambda$ thể hiện phản ứng giá của thị trường đối với tổng lệnh của LTl, cũng như tác động giá của nó. Khái niệm về tác động giá rất quan trọng đối với cả giao dịch và công việc lý thuyết, và việc sử dụng một cấu trúc tuyến tính như cấu trúc được mô tả bởi tham số $\lambda$ rất phổ biến. Cụ thể, $\lambda$ được sử dụng để mô tả tính thanh khoản của thị trường đối với tài sản này - một thị trường thanh khoản hơn sẽ có $\lambda$ thấp hơn, do cạnh tranh lớn hơn (n), khả năng chịu rủi ro thấp hơn $(gamma)$, hoặc biến động thấp hơn $(sigma^{2})$ $\sigma^{2}$ 2, và điều này dẫn đến chiết khấu/phí bảo hiểm thanh khoản thấp hơn cho các nhà giao dịch thanh khoản. Có một cách phổ biến thứ hai để đo lường tính thanh khoản dựa trên biến động giá,

và rất dễ để thấy mô hình này hoạt động như thế nào. Thước đo này dựa trên tự hiệp phương sai của lợi nhuận tài sản, mặc dù đối với mô hình Grossman-Miller, việc mô tả nó sẽ dễ dàng hơn khi xem xét tự hiệp phương sai trong biến động giá tài sản thay vì lợi nhuận. Để xem cách thức xây dựng thước đo này, chúng ta hãy giới thiệu thêm một ngày $t=0$ trước khi lệnh của LT1 được gửi ( $t=1$ ), và một sự kiện tin tức công khai ngẫu nhiên, $t1$ , ảnh hưởng đến giá thanh lý cuối cùng của tài sản, $S_{3}=\mu+$

$\epsilon_{1}+\epsilon_{2}+\epsilon_{3}$ .Tin tức công khai được công bố trong khoảng thời gian từ $t=0$ đến $t=1$ .Xác định các hằng số sau:

$$\mu_0=\mathbb{E}[S_3]:,\quad\mu_1=\mathbb{E}[S_3\mid\epsilon_1:]:,\quad\mu_2=\mathbb{E}[S_3\mid\epsilon_1,\epsilon_2:]\quad\mu_3=S_3:,$$

và cho $E_{t}$ ： $t:=:1,2,3$ là các biến ngẫu nhiên chuẩn, iid với trung bình bằng không và phương sai $\sigma^{2}$ . Quá trình rời rạc $fLt.$ là một martingale và chúng ta gọi nó là giá thị trường hiệu quả.

Theo mô hình trên, tại $t=0$ không có nhà giao dịch thanh khoản và không có giao dịch nào, do đó $S_{0}=\mathbb{E}[S_{3}]=\mu_{0}$ sẽ là giá cân bằng. Mô hình cho thấy các mức giá cân bằng tiếp theo tại $t=1$ và $t=2$ là

$$S_1=\mu_1+\lambda:q^{LT1},\quad\mathrm{and}\quad S_2=\mu_2:.$$

Để xây dựng phương sai tự động của các thay đổi giá, hãy để $\Delta_{\mathrm{l}}=S_{1}-S_{0}$ và $\Delta_{2}=S_{2}-$ $S_{1}$ và phương sai tự động của các thay đổi giá được đưa ra bởi biểu thức sau:

$$\begin{đã căn chỉnh} \mathrm{Cov}\left[\Delta_{1},\Delta_{2}\right]& =\mathrm{Cov}\left[\mu_{1}+\lambda:q^{LT1}-\mu_{0},\mu_{2}-\mu_{1}-\lambda:q^{LT1}\right] \\ &=\mathrm{Cov}\left[\epsilon_{1}+\lambda:q^{LT1},\epsilon_{2}-\lambda:q^{LT1}\right]=-\lambda^{2}:\mathrm{Var}\left[q^{LT1}\right]<0:. \end{đã căn chỉnh}$$

Trong mô hình đơn giản (về cơ bản là tĩnh) này, trong đó mọi hành động diễn ra tại $t=1$ , tự hiệp phương sai của thay đổi giá nắm bắt được tính thanh khoản của thị trường giống như tác động của giá. Một hiệu ứng thú vị mà chúng ta thấy ở đây là khi tính thanh khoản tăng và $\lambda$ tiến về 0, thì tự hiệp phương sai của thay đổi giá, và quá trình giá, hội tụ về quá trình martingale cơ bản (giá hiệu quả) $fl,t$. Hai thước đo, tác động của giá và tự hiệp phương sai của thay đổi giá (hoặc

Lợi nhuận), trở nên rõ nét trong các bối cảnh động phong phú hơn và nắm bắt các chiều hướng khác nhau của phản ứng thị trường đối với các MO sắp ra mắt. Ví dụ, trong các mô hình thời gian liên tục của các chương sau, mức tăng trưởng trung bình của giá hiệu quả bị ảnh hưởng bởi tốc độ MO ra mắt thị trường và hiệu ứng này giảm dần theo cấp số nhân. Hiệu ứng vĩnh viễn này của giá hiệu quả của tài sản ảnh hưởng đến tất cả những người tham gia thị trường và khác với hiệu ứng tạm thời mà mỗi nhà giao dịch thấy trong giá thực hiện của họ, được thể hiện bằng tham số $(\lambda)$ và không ảnh hưởng đến động lực của giá hiệu quả.

2.1.4 Tạo lập thị trường bằng lệnh giới hạn

Trong quá trình chuyển đổi từ người đấu giá Walrasian trong mô hình Grossman-Miller sang việc đo lường tác động giá, chúng tôi đã đề xuất rằng các MM tham gia thông qua việc niêm yết LO. Bây giờ chúng ta sẽ xem xét lý do tại sao một MM lại hành động theo cách này và giải pháp đơn giản nhất cho cách cô ấy làm điều đó. Tài liệu tham khảo đầu tiên thường được sử dụng cho việc này là mô hình của Ho & Stoll (1981), nhưng

Việc sử dụng mô hình gốc đòi hỏi sự quen thuộc với các kỹ thuật giải quyết các bài toán quy hoạch động ngẫu nhiên mà chúng ta sẽ thấy trong Phần II. Thay vào đó, chúng tôi thiết lập một phiên bản tĩnh của mô hình, nắm bắt một số yếu tố cơ bản của bài toán quy hoạch động ngẫu nhiên. Như trong mô hình Grossman Miller (1988), quy hoạch động ngẫu nhiên là

Một nhà giao dịch chuyên nghiệp kiếm lợi nhuận từ việc làm trung gian giữa các nhà giao dịch thanh khoản khác nhau. Trong trường hợp này, chúng tôi xem xét một nhà giao dịch nhỏ, trung lập rủi ro, quản lý hàng tồn kho không tốn kém và kiên nhẫn vô hạn. Cô ấy không yêu cầu thù lao cho dịch vụ của mình, nhưng lại kiếm được lợi nhuận từ việc lựa chọn cách cung cấp thanh khoản tối ưu trong một môi trường bất ổn với nhiều nhà quản lý tài sản (MM) khác không phản ứng với quyết định của MM.

Sự bất định trong bối cảnh này xuất phát từ thời điểm và quy mô của các MO lớn sắp ra mắt, và không có vấn đề gì về thông tin: tất cả thông tin đều được công khai để mọi người đều đồng ý về giá trị hiện tại của tài sản, được ký hiệu là $S_{t}$ và được gọi là giá trung bình. Nhà giao dịch của chúng ta là một trong nhiều MM. Chúng ta coi hành vi của các MM khác là hiển nhiên, và hành vi này được biểu thị bằng một LOB cố định, không bị ảnh hưởng bởi các quyết định của MM. MM của chúng ta kiếm tiền bằng cách thêm LOB của mình vào sổ sách và thanh toán hàng tồn kho kết quả vào các ngày sau đó. Vì MM của chúng ta không có chi phí tồn kho, không phát sinh chi phí giao dịch, trung lập rủi ro và vô cùng kiên nhẫn, chúng ta có thể giả định rằng cô ấy thanh lý hàng tồn kho của mình ở mức giá trung bình mà không mất phí. Khi đó, vấn đề của MM là chọn vị trí trên LOB để đặt LOB sao cho

để tối đa hóa lợi nhuận của cô ấy trên mỗi giao dịch, cân bằng tối ưu mức tăng giá trên mỗi giao dịch nhận được khi cô ấy tăng khoảng cách từ LO đến giá trung bình, với tần suất cô ấy sẽ giao dịch, giảm theo khoảng cách đó từ giá trung bình. Về mặt hình thức, vấn đề của MM là chọn khoảng cách từ giá trung bình, độ sâu $\delta^{\pm}$ . Sau đó, cô ấy sẽ đặt lệnh bán LO của mình tại $S_{t}+\delta^{+}$ và lệnh mua LO của mình tại $S_{t}-\delta^{-}$ Sự không chắc chắn từ các MO xuất phát từ xác suất một MO đến $(p_{\pm}$ ) và xác suất rằng một khi đến nơi, nó sẽ đưa cuốn sách đến nơi mà các LO của MM đang nằm $\delta^{\pm}$ cách giá trung bình), được mô tả bởi cdf $P_{\pm}$ . Do đó, xác suất lệnh mua LO sẽ được khớp là $p_{-}P_{-}(\delta^{-})$ Nếu chúng ta giả sử rằng phân phối của các LO khác trong LOB được mô tả bằng phân phối mũ với tham số $F_{i}^{-}$ , chúng ta có $p_{-}P_{-}(\delta^{-})=p_{-}e^{-\kappa^{-}\delta^{-}}$ Tương tự, xác suất lệnh bán LO được khớp là $p_{+}e^{-\kappa^{+}\delta^{+}}$ Rõ ràng, khi MM đặt lệnh LO của mình sâu hơn trong LOB, xác suất lệnh của cô ấy (khi MO đến) sẽ giảm, mặc dù lợi nhuận trên mỗi giao dịch ( $\delta^{\pm}$ ) sẽ tăng Bảng bên trái của Hình 2.2 minh họa một LOB giả định xung quanh mức giá trung bình

của $S_{t}$ và hai lệnh giới hạn khả thi: một lệnh bán LO ở phía chào bán tại $S_{t}+\delta^{+}$ và một lệnh mua LO ở phía chào bán tại $S_{t}-\delta^{-}$. Bảng bên phải mô tả phân phối xác suất tương ứng, $P^{+}$ ( $P^{-}$ ), của lệnh được đăng ở khoảng cách $\delta^{+}$ $\delta^{-}$ ) từ giá trung bình, có điều kiện là phải có MO mua (bán).

Sử dụng 11 để biểu thị lợi nhuận của MM trên mỗi giao dịch, bài toán tối ưu hóa của MM được đưa ra theo biểu thức sau:

$$\max\limits_{\delta^+,\delta^-}\mathbb{E}\left[:\Pi(\delta^+,:\delta^-):\right]=\max\limits_{\delta^+,:\delta^-}:\left{p^+:e^{-\kappa^+\delta^+}:\delta^++p^-:e^{-\kappa^-\delta^-}:\delta^-\right}:.$$

Có thể dễ dàng nhận thấy rằng giải pháp là đăng LO ở độ sâu sau:

$$\delta^{\pm,*}=\frac{1}{\kappa^{\pm}}:.$$

Hình 2.2 LOB và xác suất thực hiện.

Với sự lựa chọn tham số $P_{\pm}$ của chúng ta, độ sâu tối ưu bằng với độ sâu trung bình trong LOB

Mô hình này nắm bắt một cách đơn giản sự đánh đổi giữa xác suất thực hiện và biên độ cho mỗi giao dịch. Tuy nhiên, nó rất không thực tế ở một số chiều: dạng hàm của tất cả các thành phần ngẫu nhiên của mô hình $P_{\pm}$ và $p^{\pm}$ ) là rất đặc biệt, hằng số và ngoại sinh, quyết định của MM và quyết định của các nhà giao dịch khác (được nắm bắt bởi $P(\delta)$ ) là độc lập, hàm mục tiêu của MM là tĩnh và rất đơn giản. Tuy nhiên, để giải quyết những vấn đề khác này, chúng ta cần các phương pháp và mô hình phức tạp hơn, vì vậy sau khi phát triển các phương pháp đó trong các chương sau, chúng ta sẽ xem xét lại một số phương pháp trong số đó. Ví dụ, trong Chương 10, chúng ta thấy cách các MM quyết định cách đăng lệnh giới hạn trong mô hình hàng tồn kho động được liên kết đầy đủ và cách cô ấy điều chỉnh các bài đăng của mình nếu giao dịch với các đối tác có thông tin tốt hơn - một chủ đề mà chúng ta sẽ thảo luận tiếp theo.

2.2 Giao dịch dựa trên lợi thế thông tin

Cho đến nay, chúng ta đã bỏ qua một trong những vấn đề chính trong giao dịch: sự khác biệt về thông tin. Nhiều giao dịch bắt nguồn không phải vì ai đó cần tiền mặt và bán tài sản, hoặc có tiền mặt dư thừa và muốn đầu tư, mà vì một bên có (hoặc tin rằng mình có) thông tin tốt hơn về diễn biến giá so với giá hiện tại. Vì vậy, sau khi xem xét các mô hình tạo lập thị trường cơ bản trong bối cảnh thông tin công khai, chúng ta chuyển sang vấn đề cơ bản tiếp theo: làm thế nào để khai thác lợi thế thông tin trong khi vẫn tính đến tác động của giá. Tài liệu tham khảo chính trong trường hợp này là Kyle (1985). Kyle (1985) xem xét vấn đề quyết định của một nhà giao dịch có thông tin mạnh mẽ.

lợi thế hợp lý (trường hợp của một số nhà giao dịch có thông tin cạnh tranh được Kyle (1989) nghiên cứu trong bối cảnh giá cả ^hiệu quả'. Mô hình trong Kyle (1985) cho chúng ta biết cách nhà giao dịch có thông tin điều chỉnh chiến lược giao dịch của mình một cách tối ưu để tính đến phản ứng của thị trường và đặc biệt là tác động về giá mà các giao dịch của anh ta tạo ra ở trạng thái cân bằng.

Để đi sâu vào chi tiết của mô hình, trước tiên chúng ta cần định nghĩa khái niệm "lợi thế thông tin mạnh mẽ" và hiệu quả về giá trong bối cảnh này. Để đơn giản, chúng ta chỉ xem xét bài toán quyết định tĩnh của nhà đầu tư. Ý tưởng cơ bản tương tự cũng được mở rộng sang bối cảnh động. Mô hình tĩnh chính thức như sau: có một thị trường cho một tài sản mở cửa tại một thời điểm. Tài sản được giao dịch ở mức giá $S$, và sau khi giao dịch, tài sản có giá trị tiền mặt bằng $U$. Giá trị tiền mặt trong tương lai của tài sản, $T$, là không chắc chắn. Cụ thể, 2 được cho là phân phối chuẩn với trung bình $\mu$ và phương sai $\sigma^{2}$. Trên thị trường, có ba loại nhà giao dịch: một nhà giao dịch có hiểu biết, một khối lượng ẩn danh gồm các nhà giao dịch thanh khoản không nhạy cảm với giá (các nhà giao dịch cần thực hiện giao dịch bất kể chi phí nào) và một số lượng lớn các MM quan sát và cạnh tranh để giành được luồng lệnh, tức là các MM quan sát và cạnh tranh để giành được luồng lệnh mua và bán đến từ các nhà giao dịch có hiểu biết và thanh khoản. Trái ngược với bối cảnh của Grossman & Miller (1988), các MM là trung lập về rủi ro,

vì vậy họ không cần phí bảo hiểm thanh khoản để bù đắp cho rủi ro giá từ việc nắm giữ hàng tồn kho. Do đó, bất kỳ phí bảo hiểm thanh khoản nào phát sinh sẽ đến từ nhu cầu bù đắp cho các MM về bất lợi thông tin của họ - và điều này sẽ do các nhà giao dịch thanh khoản không nhạy cảm với giá gánh chịu. Những nhà giao dịch thanh khoản này sẽ có, tổng hợp, một nhu cầu ròng được biểu thị bằng số lượng ngẫu nhiên $u$ sao cho nếu $u>0$, về tổng thể, các nhà giao dịch thanh khoản muốn mua $u$ đơn vị, trong khi nếu $u<0$, các nhà giao dịch này muốn bán $\left|u\right|$ đơn vị tài sản. Giả sử rằng $U$ phân phối chuẩn với trung bình bằng không, phương sai $\sigma_{u}^{2}$ và độc lập với 2. Về nguyên tắc, vì các nhà giao dịch thanh khoản không nhạy cảm với giá (u không phụ thuộc vào S) nên các MM có thể tính phí thanh khoản rất lớn, nhưng sự cạnh tranh về luồng lệnh giữa các MM đẩy phí thanh khoản xuống bằng 0, do đó (khi chỉ có các MM và nhà giao dịch thanh khoản) $S=\mathbb{E}[v]$ Bây giờ hãy xem xét khả năng một nhà giao dịch mới tham gia thị trường và

Nhà giao dịch này ("người trong cuộc") biết giá trị chính xác của $\mathcal{L}$. Người trong cuộc là người duy nhất biết v và chọn khối lượng giao dịch. Giả sử $x(v)$ biểu thị số lượng cổ phiếu được giao dịch bởi người trong cuộc. Mặt khác, các MM biết rằng có một nhà giao dịch am hiểu trên thị trường, nhưng không biết nhà giao dịch này là ai.

Để phân tích chính thức, mô hình được cấu trúc như sau: (i) người trong cuộc quan sát $U$, (i) khi quan sát u, người trong cuộc chọn $x(v)$ , (ii) $u$ được thực hiện, (iv) các MM quan sát luồng lệnh ròng, $x(v)+u$, (v) dựa trên luồng lệnh ròng, các MM cạnh tranh để đặt giá tài sản, S

Để giải quyết mô hình, chúng tôi sử dụng khái niệm giải pháp cân bằng Nash (Bayesian) mà không đi sâu vào chi tiết. Điều này có nghĩa là tất cả các tác nhân đều tối ưu hóa dựa trên quyết định của tất cả những người chơi khác, theo niềm tin của họ (được cập nhật theo quy tắc Bayes bất cứ khi nào có thể). Do đó, chúng tôi yêu cầu rằng ở trạng thái cân bằng, người trong cuộc chọn $x(v)$ để tối đa hóa lợi nhuận kỳ vọng của mình, có tính đến động lực của trò chơi (tức là lệnh của anh ta sẽ được trộn lẫn với lệnh của các nhà giao dịch thanh khoản), và dự đoán rằng các nhà quản lý quỹ sẽ đặt giá dựa trên những gì họ học được từ việc quan sát dòng lệnh và những gì họ biết về vấn đề quyết định của nhà giao dịch có hiểu biết. Ngoài ra, chúng tôi yêu cầu các nhà quản lý quỹ lựa chọn

giá của họ có tính đến chiến lược của người trong cuộc (cụ thể, họ dự đoán dạng hàm của $x(v)$) và các đặc tính của luồng lệnh không được thông báo đến từ các nhà giao dịch thanh khoản. Cụ thể, các MM đặt giá thị trường như một hàm của luồng lệnh ròng, $S(x+u)$. Điều này rất quan trọng, vì mô hình tự nhiên cho chúng ta biết rằng giá cả bị ảnh hưởng bởi luồng lệnh, do đó giao dịch tự động tạo ra tác động giá - giá trung bình trên mỗi đơn vị được giao dịch, 5 di chuyển theo luồng lệnh ròng, $x+u$. Chúng ta cần xem xét trạng thái cân bằng của mô hình để xem hàm tác động giá đó trông như thế nào. Tuy nhiên, ở trạng thái cân bằng, người trong cuộc sẽ dự đoán dạng hàm của $S(x+u)$, nghĩa là, cô ấy sẽ kết hợp tác động giá khi chọn $x(v)$ 3 Trạng thái cân bằng là một điểm cố định trong quá trình tối ưu hóa $2L$ cho dạng hàm của S và của S cho dạng hàm của 32 Hãy xem xét người trong cuộc nên làm gì. Phản ứng tự nhiên nhất là: bán nếu

$v<\mathbb{E}[v]=\mu$ và mua nếu $v>\mu$, và dù bán hay mua, hãy làm như vậy càng nhiều càng tốt để tận dụng lợi thế thông tin của mình. Điều này có vẻ tự nhiên, nhưng chúng ta phải tính đến việc các MM sẽ điều chỉnh giá của họ theo luồng lệnh mà họ quan sát. Do đó, ngay cả khi $v<\mu$, người trong cuộc không thể kỳ vọng $S=\mu$. Trong trường hợp cực đoan, khi không có nhà giao dịch thanh khoản, mọi người đều biết rằng bất kỳ giao dịch nào cũng đến từ người trong cuộc và do đó, các MM, dự đoán nhu cầu như một hàm số của việc thực hiện $v$, hành động tối ưu và đặt giá kết hợp tất cả thông tin về $U$ trong $x(v)$. May mắn thay cho người trong cuộc, có những nhà giao dịch thanh khoản thêm nhiễu vào luồng lệnh và cho phép người trong cuộc ngụy trang giao dịch của mình để đạt được lợi nhuận kỳ vọng dương. Vậy, các MM đặt giá của họ như thế nào? Điều đầu tiên cần lưu ý là khi các MM

Cạnh tranh để giành dòng lệnh, bất kỳ lợi nhuận nào họ có thể khai thác đều bị cạnh tranh loại bỏ. Do đó, bất kể chiến lược giá nào, nó sẽ dẫn đến lợi nhuận kỳ vọng bằng 0 cho các MM (trung lập rủi ro) của chúng ta, mặc dù không bao giờ là lợi nhuận âm vì họ luôn có thể chọn không giao dịch. Điều kiện lợi nhuận (kỳ vọng) bằng 0 buộc giá phải có một tính chất rất cụ thể: $S:=:\mathbb{E}[v\mid\mathcal{F}]$ , trong đó $F$ biểu thị tất cả thông tin mà các MM có. Tính chất này được gọi là hiệu quả bán mạnh: giá phản ánh tất cả thông tin công khai (trong trường hợp của chúng ta là dòng lệnh, tức là tất cả thông tin mà các MM có).4 Đây là lý do tại sao chúng ta có thể dễ dàng xác định một tính chất cơ bản của chiến lược cân bằng của các MM:

$$S(x+u)=\mathbb{E}[v\mid x+u]:.$$

Để giải mô hình, chúng ta cần tìm $x(v)$ tối ưu, tức là nó tối đa hóa lợi nhuận giao dịch kỳ vọng của người trong cuộc, với điều kiện tuân theo quy tắc định giá này. Do tính chuẩn của 2 và $UL$, chúng tôi giả thuyết rằng $S(x+u)$ là tuyến tính trong luồng lệnh ròng. Cụ thể, giả sử

$$S(x+u)=\mu+\lambda(x+u),$$

3 Về mặt hình thức, các nhà giao dịch thanh khoản được thay thế bằng một người chơi “tự nhiên” thực hiện nhu cầu ngẫu nhiên 244 Khái niệm về hiệu quả giá được đưa ra bởi người đoạt giải Nobel gần đây, Eugene Fama, xem Fama (1970),

trong đó $\lambda$ là một tham số chưa biết biểu thị độ nhạy tuyến tính của giá thị trường đối với dòng lệnh.

Lấy hình thức chức năng cụ thể này làm ví dụ, hãy xem xét vấn đề của người trong cuộc

$$\max_{x}\mathbb{E}\left[x\left(vS(x+u)\right)\right].$$

Thay thế cho $S(x+u)=\mu+\lambda\left(x+u\right)$ và lấy kỳ vọng đối với $u$, ta thu được hàm mục tiêu lõm và điều kiện bậc nhất cho kết quả

$$x^*(v)=\beta\left(v-\mu\right),$$

trong đó $\beta=(2\lambda)^{-1}$

Bởi vì chúng ta đã đưa ra giả thuyết về dạng hàm của hàm giá, bây giờ chúng ta phải xác nhận rằng dạng hàm này phù hợp với $x(v)$ tối ưu và đồng thời chúng ta có thể mô tả $\lambda$ ..Chúng ta biết rằng $S=\mathbb{E}\left|v\mid x+u\right|$ Từ $3L$ tối ưu, chúng ta biết rằng

$$x+u=\beta(v-\mu)+u=\beta\mu+\beta vu.$$

Vì $U$ và $UL$ độc lập và chuẩn, $x+u$ là chuẩn với trung bình $\mu(1+\beta)$ và phương sai $\beta^{2}\sigma^{2}+\sigma_{u}^{2}$ Bây giờ chúng ta có thể tính toán phân phối chung của $V$ và $\hat{x}+\hat{u}$ và từ đó chúng ta có thể suy ra $S=\mathbb{E}\left[v\mid x+u\right]$, (sử dụng định lý chiếu cho các biến ngẫu nhiên chuẩn và đơn giản hóa) được đưa ra bởi

$$S=\mu+2(x+u):\frac{\sigma_u}{\sigma},$$

do đó tham số độ nhạy tuyến tính là $\lambda=2\sigma_{u}/\sigma$ . Điều này xác nhận rằng trạng thái cân bằng được giả thuyết thực sự là trạng thái cân bằng (để có bằng chứng chính thức, hãy xem Kyle (1985).

Ngay cả trong phiên bản tĩnh đơn giản của mô hình Kyle, chúng ta có thể thấy rõ các vấn đề phát sinh khi đối mặt với giao dịch có thông tin (còn được gọi là "dòng lệnh độc hại"). Trong khi ở các mô hình trước, các MM chỉ cần phí bảo hiểm thanh khoản (chiết khấu) để trang trải chi phí dự kiến từ sự bất ổn giá trong tương lai, thì sự hiện diện của các nhà giao dịch có thông tin ngụ ý rằng các MM sẽ bị lựa chọn bất lợi, mua khi các nhà giao dịch có thông tin biết rằng sẽ tốt hơn nếu bán và bán khi sẽ tốt hơn nếu mua. Lựa chọn bất lợi này đòi hỏi một khoản phí bảo hiểm cao hơn do các nhà giao dịch khác (thanh khoản thiếu kiên nhẫn hơn) gánh chịu. Trong mô hình này, phí bảo hiểm bổ sung có dạng điều chỉnh giá theo dòng lệnh (tác động đến giá) như được mô tả bởi lambda của Kyle (tham số $\lambda$ mà chúng ta vừa suy ra). Khoản phí bảo hiểm này không tính đến rủi ro rằng các biến động giá trong tương lai sẽ là ngẫu nhiên, như được mô tả trong Phần 2.1.1, mà là cho lựa chọn bất lợi mà các MM phải đối mặt, vì giá trung bình sẽ di chuyển ngược lại vị thế của các MM vì họ giao dịch với các nhà giao dịch có thông tin tốt hơn trên thị trường. Dấu hiệu của $\lambda$ sẽ giống như trong Grossman & Miller (1988): giá di chuyển theo dòng lệnh, tăng khi các MO mua xuất hiện trên thị trường và giảm khi các nhà giao dịch bán mạnh.

Hình 2.3 Mô hình Glosten-Milgrom.

Tạo lập thị trường với bất lợi về thông tin

Mô hình Kyle tập trung vào vấn đề của nhà giao dịch có hiểu biết, đồng thời sử dụng kiến nghị com để mô tả các quyết định của MM. Vì chúng tôi rất quan tâm đến vấn đề của MM, giờ đây chúng tôi chuyển sang Glosten & Milgrom (1985) để tìm một mô hình đặt MM vào trung tâm của vấn đề giao dịch với các đối tác có thông tin vượt trội. Một lần nữa, chúng tôi xem xét một phiên bản đơn giản hóa và (về cơ bản) tĩnh của mô hình này.

cho phép chúng ta nắm bắt được bản chất vấn đề quyết định của MM. Tình hình vẫn như trước: có các nhà giao dịch thanh khoản, các nhà giao dịch am hiểu và một nhóm MM cạnh tranh. MM trung lập về rủi ro và không có chi phí rõ ràng nào từ việc lưu trữ hàng tồn kho. Mô hình đơn giản của chúng tôi (được mô tả trong Hình 2.3) có giá trị tiền mặt tương lai của tài sản

bằng v mà chúng ta giới hạn ở hai giá trị có thể: $V_{H}>V_{L}$, tức là giá trị Cao và giá trị Thấp. Xác suất không điều kiện của $v=V_{H}$ là $P$. Tất cả các lệnh đều là một đơn vị, các MM đăng một LO để bán một đơn vị ở mức giá $a$ và một LO mua cho một đơn vị ở mức giá $b$. Chúng ta bắt đầu bằng cách giả định rằng các nhà giao dịch thanh khoản không nhạy cảm với giá và muốn mua với xác suất 1/2 và muốn bán với xác suất 1/2. Có nhiều nhà giao dịch có hiểu biết, tất cả đều biết 2 nhưng bị giới hạn giao dịch một đơn vị duy nhất, điều này đơn giản hóa quyết định của họ: khi $v=V_{H}$ họ mua một đơn vị nếu $a<V_{H}$ và không làm gì khác, trong khi khi $v=V_{L}$ họ bán một đơn vị nếu $b\gg V_{L}$ và không làm gì khác. Tổng dân số của các nhà giao dịch thanh khoản và có hiểu biết được chuẩn hóa thành một, và trong số đó, một tỷ lệ $UY$ được hiểu biết và một tỷ lệ $(1-\alpha)$ là các nhà giao dịch thanh khoản không có hiểu biết. Hình 2.3 thể hiện cấu trúc xác suất của mô hình: Bản chất ngẫu nhiên

xác định xem trạng thái cơ bản là $V_{H}$ hay $V_{L}$ Độc lập với trạng thái, một nhà giao dịch được chọn ngẫu nhiên từ dân số, do đó với xác suất $U$ cô ấy được thông báo và với xác suất $1-\alpha$ cô ấy không được thông báo. Một nhà giao dịch có thông tin sẽ luôn mua ở giá chào bán $(a)$ khi giá trị của tài sản là $V_{H}$ và bán ở giá chào mua (b) khi giá trị của tài sản là $V_{L}$, trong khi một nhà giao dịch không có thông tin sẽ mua hoặc bán với xác suất bằng nhau, độc lập với giá trị thực (chưa biết) của tài sản. Vấn đề của MM là chọn $d$ và $b$ trong bối cảnh này. Bởi vì các nhà giao dịch thanh khoản

không nhạy cảm với giá, giải pháp tối ưu là đơn giản: đặt $a=V_{H}$ và $b=V_{L}$, nhưng vì các MM cạnh tranh để kinh doanh, giá sẽ lại được đặt ở mức hiệu quả (bán mạnh) của chúng, điều này xảy ra vì các MM chỉ sử dụng thông tin công khai, bao gồm cả luồng lệnh. Nếu các MM có thông tin riêng ngoài luồng lệnh, trong bối cảnh này, sự cạnh tranh để giành luồng lệnh sẽ kết hợp một số thông tin đó vào giá. Cạnh tranh giữa các MM đẩy lợi nhuận kỳ vọng của họ về 0. Do đó, $u$ và $b$

được xác định bởi điều kiện không lợi nhuận. Thay vì giải $a$ và $b$, hãy xác định trực tiếp mức chênh lệch giá bán và giá mua, $\Delta_{a}$ và $\Delta_{b}$ tương ứng. Tổng của hai mức chênh lệch này, $\Delta_{a}+\Delta_{b}$, biểu diễn mức chênh lệch (được niêm yết). Giả sử giá trị kỳ vọng của tài sản $\mu=\mathbb{E}[v\mid\mathcal{F}]$, trong đó $F$ biểu diễn tất cả thông tin công khai trước khi giao dịch. Khi đó, như mô tả ở cuối Hình 2.3, các nhà quản lý quỹ sẽ chọn $a=\mu+\Delta_{\alpha}$ và $b=\mu-\Delta_{b}$ một cách tối ưu. Để xác định tác động của việc chọn $a$ và $b$ lên lợi nhuận và thua lỗ kỳ vọng, hãy xem xét điều gì xảy ra khi một lệnh mua được đưa vào:

●nếu nó đến từ một nhà giao dịch thanh khoản không có thông tin, cô ấy sẽ kiếm được lợi nhuận dự kiến là $a-\mu=\Delta_{a}$ ●nếu nó đến từ một nhà giao dịch có thông tin, cô ấy sẽ kiếm được khoản lỗ dự kiến là $a-V_{H}=$ $\Delta_{a}-(V_{H}-\mu)$

Theo quan điểm của MM, xác suất một nhà giao dịch thanh khoản muốn mua là 1/2, trong khi xác suất một nhà giao dịch có thông tin muốn mua là $P$ (vì tất cả các nhà giao dịch có thông tin sẽ mua nếu trạng thái là $v=V_{H}$ xảy ra với xác suất $\dot{P}$). Vì có $1-\alpha$ nhà giao dịch thanh khoản và $\alpha$ nhà giao dịch có thông tin, nên lợi nhuận dự kiến từ việc niêm yết giá $a=\mu+\Delta_{a}$ là

$$\frac{(1-\alpha)/2}{\alpha p+(1-\alpha)/2}\Delta_{a}+\frac{p\alpha}{\alpha p+(1-\alpha)/2}\left(\Delta_{a}-(V_{H}-\mu)\right):.$$

Đặt lợi nhuận kỳ vọng này về 0 chúng ta thu được

$$\Delta_{a}=\frac{\alpha p}{\alpha p+(1-\alpha)/2}\left(V_{H}-\mu\right)=\frac{1}{1+\frac{1-\alpha}{\alpha}\frac{1/2}{p}}\left(V_{H}-\mu\right):,$$

và theo lý luận tương tự,

$$\Delta_{b}=\frac{1}{1+\frac{1-\alpha}{\alpha}\frac{1/2}{1-p}}:(\mu-V_{L}):.$$

Để diễn giải các phương trình này, chúng ta hãy dán nhãn các biến. Nếu chúng ta coi thông tin không đối xứng là 'độc tính' thì chúng ta có thể coi $d$ là mức độ phổ biến của độc tính, $1-F$

và $V_{H}-\mu$ là mức độ độc hại của việc mua và $1-p$ và $\mu-V_{L}$ là mức độ độc hại của việc bán. Sau đó, các phương trình trên mô tả cách các MM điều chỉnh chênh lệch giá bán-nửa và chênh lệch giá mua-nửa, và tăng nó theo mức độ phổ biến và mức độ độc hại của việc mua và bán.

Trong các chương sau, chúng tôi sẽ trình bày cách các thuật toán giao dịch được xây dựng để tận dụng lợi thế về thông tin hoặc điều chỉnh độ sâu của các lệnh LO được ghi nhận nhằm bù đắp tổn thất từ các đại lý giao dịch cho các nhà giao dịch am hiểu hơn. Ví dụ, trong Mục 7.3, chúng tôi phát triển các thuật toán giao dịch sử dụng thông tin được cung cấp theo thứ tự để điều chỉnh tỷ lệ mua vào hoặc thanh lý khi đại lý muốn tham gia hoặc thoát khỏi một vị thế lớn. Chúng tôi cũng sẽ trình bày cách chiến lược của MM phụ thuộc vào việc liệu họ có nắm được thông tin chi tiết, tần suất cao về các biến động ngắn hạn trong xu hướng biến động của tài sản mà họ đang giao dịch hay không, xem ví dụ tại Mục 10.4.2

2.3.1 Biến động giá

Mô hình đơn giản này có thể được mở rộng theo hai cách khác nhau và bổ sung cho nhau: bằng cách kết hợp chiều thời gian và bằng cách làm cho các nhà giao dịch thanh khoản nhạy cảm với giá. Cách đầu tiên rất đơn giản. Để tránh phải theo dõi lãi suất, hãy đặt nó bằng không. Sau đó, lập chỉ mục cho tất cả các biến theo thời gian $t$ và đặt thời điểm xác định giá trị tiền mặt của tài sản là $T$. Hơn nữa, hãy đảm bảo rằng các xác suất và kỳ vọng được điều chỉnh để kết hợp sự tích lũy thông tin công khai từ giao dịch, được thu thập bởi quá trình lọc $\mathcal{F}{t}$. Khi các MM quan sát các chuỗi lệnh mua và bán khác nhau, họ sẽ điều chỉnh (sử dụng quy tắc Bayes²) ước tính phân phối của $V$ và đặc biệt là họ đặt $p{t}=\mathbb{P}\left(v=V_{H}\mid\mathcal{F}_{t}\right)$ và $\mu_t=\mathbb{E}[v\mid\mathcal{F}_t]$. Sau đó, giá mua và giá bán sẽ điều chỉnh để đáp ứng với lịch sử giao dịch, do đó

$$a_t=\mu_t+\Delta_{a,t}=\mu_t+\frac{1}{1+\frac{1-\alpha}{\alpha}\frac{1/2}{p_t}}\left(V_H-\mu_t\right):,$$

Và

$$b_t=\mu_t-\Delta_{b,t}=\mu_t-\frac{1}{1+\frac{1-\alpha}{\alpha}\frac{1/2}{1-p_t}}\left(\mu_t-V_L\right):.$$

Giá mua-bán kết quả hiển thị những thay đổi động phản ánh thông tin công khai được nhúng trong luồng lệnh. Cũng cần lưu ý rằng tại mỗi lần thực hiện, giá thực hiện ( $U_{t}$ nếu đó là lệnh mua thị trường, và $b_{t}$ nếu đó là lệnh bán) bằng với kỳ vọng của tài sản cơ sở tùy thuộc vào lịch sử luồng lệnh, $\mathcal{F}_{t}$, và cũng tùy thuộc vào thông tin trong quá trình thực hiện (tức là mua hoặc bán). Do đó, có thể thấy rằng quy trình giá thực tế (quy trình giá tại thời điểm thực hiện) là một martingale (xét theo thước đo khách quan).

Một phần mở rộng thú vị của mô hình tĩnh (có thể được mở rộng hơn nữa để bao gồm động lực mà chúng ta vừa thấy) là cho phép các nhà giao dịch thanh khoản tránh giao dịch nếu mức chênh lệch một nửa, $\Delta$, quá cao. Một cách trực tiếp để thực hiện điều này là giả sử rằng các nhà giao dịch thanh khoản nhận được một giá trị bổ sung (ngoại sinh) từ việc thực hiện giao dịch mong muốn của họ, do đó nhà giao dịch i nhận được mức tăng tiện ích tương đương tiền mặt là $C_{i}$ nếu anh ta thực hiện được giao dịch mong muốn của mình. Do đó, nếu chi phí giao dịch do mức chênh lệch một nửa áp đặt quá cao, cao hơn $C_{i}$ , nhà giao dịch $i$ sẽ không muốn thực hiện giao dịch của mình. Giả sử rằng phân phối của tham số $C_{i}$ trong quần thể các nhà giao dịch thanh khoản được mô tả bởi hàm phân phối tích lũy $F$, sao cho $F(c)$ là tỷ lệ các nhà giao dịch thanh khoản có $C_{i}\leq C_{i}$ . Chúng ta gọi $C_{i}$ là tham số cấp bách của tác nhân. Sau đó, chúng ta có thể tính toán lại lợi nhuận dự kiến của MM từ việc đặt giá chào bán

giá $a=\mu+\Delta_{\mathrm{cr}}$ như trên, bây giờ sẽ được đưa ra bởi

$$\frac{(1-F(\Delta_a))(1-\alpha)/2}{\alpha p+(1-F(\Delta_a))(1-\alpha)/2}\Delta_a+\frac{p\alpha}{\alpha p+(1-F(\Delta_a))(1-\alpha)/2}\left(\Delta_a-(V_H-\mu)\right).$$

Trong biểu thức này, chúng tôi đã kết hợp thực tế rằng bất cứ khi nào một nhà giao dịch thanh khoản muốn mua $(1-\alpha)/2$, chỉ $1-F(\Delta_{a})$ mới đủ khẩn cấp để thực hiện giao dịch với mức chênh lệch mua một nửa bằng $\Delta_{a}$. Việc đưa tham số này vào sẽ làm tăng mức chênh lệch một nửa, hiện được xác định ngầm định bởi các biểu thức sau:

$$\Delta_{\alpha}=\frac{1}{1+\frac{1-\alpha:(1-F(\Delta_{a}))/2}{\alpha}}\left(V_{H}-\mu\right):,$$

và theo lý luận tương tự,

$$\Delta_{b}=\frac{1}{1+\frac{1-\alpha:(1-F(\Delta_{a}))/2}{\alpha}}\left(\mu-V_{L}\right):.$$

Vấn đề then chốt hiện nay là khi MM tăng halfspread, cô ấy sẽ phải đối mặt với một nhóm nhỏ hơn các nhà giao dịch thanh khoản. Nếu các tham số khẩn cấp trong nhóm tương đối nhỏ, MM có thể thấy rằng các biểu thức trên chỉ có nghiệm cực trị $\Delta_{\mathrm{a}}=V_{H}-\mu$ và $\Delta_b=\mu-V_L$. Các nghiệm cực trị này tương ứng với các nghiệm không có nhà giao dịch thanh khoản và thể hiện sự sụp đổ của thị trường. Với những spread này, không ai được lợi gì từ giao dịch, và bất kỳ giao dịch nào có thể xảy ra đều đến từ các tác nhân có hiểu biết, những người thờ ơ với việc giao dịch hay không giao dịch, mặc dù bất kỳ giao dịch nào cũng sẽ ngay lập tức tiết lộ giá trị cơ bản của tài sản và giá sẽ rất hiệu quả.

Tài liệu tham khảo và bài đọc chọn lọc

Grossman (1976), Grossman (1977), Grossman (1978), Ho & Stoll (1981), Gross-

man & Miller (1988), Glosten & Milgrom (1985), Kyle (1985), Kyle (1989), de Jong & Rindi (2009), O'Hara (1995), Abergel và cộng sự. (2012), Easley, Lopez de Prado & O'Hara (2012), Vayanos & Wang (2009), SEC (2013b), SEC (2013a), O'Hara, Yao & Ye (2014), Foucault, Kadan & Kandel (Mùa đông 2005), Rosu 2009EasleyEngleO'Hara & Wu 2008)Easley & O'Hara 1992Biais Glosten & Spatt (2005), Cartea & Penalva (2012), Boehmer, Fong & Wu (2014), Pascual & Veredas (2009), Martinez & Rosu (2013), Martinez & Rosu (2014), Hoffmann (2014), Cvitanic & Kirilenko (2010), Vives (1996), Colliard & Foucault (2012), Foucault & Menkveld (2008), Gerig (2008), Nông dân, Gerig, Lillo & Waelbroeck (2013), Gerig & Michayluk (2010), Cohen & Szpruch (2012), Jarrow & Li (2013), Moallemi & Saglam (2013).

3 Bằng chứng thực nghiệm và thống kê: Giá cả và lợi nhuận

Giới thiệu 3.1

Hai chương tiếp theo bao gồm phân tích thực nghiệm về các khía cạnh khác nhau của giá giao dịch, lợi nhuận, chênh lệch giá, khối lượng giao dịch, v.v., chủ yếu sử dụng dữ liệu được đóng dấu mili giây, mặc dù chúng tôi bắt đầu với dữ liệu hàng ngày để cung cấp cái nhìn tổng quan về các vấn đề chính. Chương 3 tập trung vào giá và lợi nhuận, trong khi Chương 4 dành riêng cho khối lượng giao dịch và các thước đo chất lượng thị trường như chênh lệch giá, độ biến động hoặc độ sâu.

Chương này trước tiên sẽ xem xét dữ liệu mili giây. Sau đó, chúng ta sẽ xem xét các đặc tính của lợi nhuận theo cả khoảng thời gian hàng ngày và ngắn hơn nhiều (một giây), cũng như xem xét thời gian giữa các lần thay đổi giá. Phần 3.4 xem xét cách các điều kiện thị trường có thể thay đổi khi đối mặt với độ trễ, cũng như vấn đề về kích thước tick. Tiếp theo là phần thảo luận về động lực giá. Phần 3.6 cung cấp cái nhìn thoáng qua về vấn đề phân mảnh thị trường tại Hoa Kỳ, trong khi phần cuối cùng cung cấp cái nhìn đầu tiên về kinh nghiệm thực tế của giao dịch cặp. Bên cạnh phân tích thực nghiệm, chúng tôi cũng đưa ra các diễn giải hợp lý.

và suy đoán về những gì có thể ẩn chứa đằng sau một số kết quả phân tích đó. Những suy đoán này được đưa vào để làm cho chương hấp dẫn hơn và khuyến khích người đọc suy ngẫm về kết quả. Tuy nhiên, chúng không nên được hiểu là bất cứ điều gì khác ngoài lý thuyết suy đoán, và nên được tách biệt khỏi phân tích mô tả các sự kiện thực nghiệm vốn bị giới hạn trong phạm vi mẫu dữ liệu chúng tôi đang sử dụng.

3.1.1 Dữ liệu

Chúng tôi sử dụng dữ liệu từ nhiều nguồn. Đối với dữ liệu hàng ngày và hàng tháng, chúng tôi sử dụng dữ liệu tổng hợp công khai từ Yahoo! Finance và dữ liệu từ Trung tâm Nghiên cứu Giá Chứng khoán (CRSP). Chúng tôi cũng sử dụng dữ liệu ITCH có dấu thời gian mili giây (dữ liệu chuẩn công nghiệp công khai, tương tự như nguồn cấp dữ liệu trực tiếp, gần đây dấu thời gian được chuyển sang độ phân giải nano giây). Dữ liệu của chúng tôi đã được chuyển đổi sang định dạng bảng để dễ xử lý hơn và ở dạng nhị phân vì lý do tốc độ và lưu trữ. Để minh họa, chúng tôi chuyển đổi chúng sang dạng dễ đọc hơn. Dữ liệu bao gồm các trường sau (chúng tôi bỏ qua hai trường không liên quan ở đây):

Dấu thời gian: số mili giây sau nửa đêm

●Mã lệnh: Mã lệnh duy nhất ●Loại tin nhắn: -“B" Thêm lệnh mua “S" Thêm lệnh bán —“E"— Thực hiện lệnh chưa thanh toán ở phần “C" — Hủy lệnh chưa thanh toán ở phần —“F"Thực hiện toàn bộ lệnh chưa thanh toán “D" Xóa toàn bộ lệnh chưa thanh toán “"X" Khối lượng lớn cho sự kiện chéo ——"T" _ Thực hiện lệnh không hiển thị Cổ phiếu: số lượng lệnh (Không cho tin nhắn “F” và “D”) Giá: không cho lệnh hủy và lệnh thực hiện Mã chứng khoán: mã chứng khoán được liên kết với tài sản đang xem xét ●MPID: ID người tham gia thị trường được liên kết với giao dịch ●Sàn giao dịch: ID của thị trường hiện tại (NASDAQ = 1)

Các thông báo này ghi lại các sự kiện ảnh hưởng đến sổ lệnh giới hạn (LOB), do đó về cơ bản, chúng nắm bắt được những gì xảy ra với các lệnh giới hạn (LO). Các lệnh LO được ghi (B, S) và sau đó bị hủy (C, D) hoặc được thực hiện (E, F). Vì vậy, các lệnh thị trường (MO) không được ghi lại mà phải được suy ra từ việc quan sát cách chúng được thực hiện so với các lệnh LO đang chờ (hoặc so với các lệnh không hiển thị/ẩn, T).

Hãy xem xét ví dụ sau (số hàng đã được thêm vào để tạo điều kiện thuận lợi cho việc thảo luận và chúng tôi đã bỏ cột MPID)

1: 33219784 4889087 B 1900 TZA13458002 332197844887036 C 2000 FMS13:332197844879129D 00 QQQQ120004548004332197844889088S QQQQ15:33219784 4879130D 00 QQQQ15006 33219784 4889089 S 454800 QQQQ107 33219785 4882599 D 0 QQQQ1833219785 4888889 F 0 STD10

Những tin nhắn này được gửi đến thị trường trong khoảng thời gian từ 33219784 đến 33219785 ms tính từ nửa đêm (ngày 13 tháng 7 năm 2010), tức là từ 09:13:39.784 đến 09:13:39.785. Chúng tôi thấy một số tin nhắn cho ETF QQQQ, và một tin nhắn cho ETF TZA, cùng với các cổ phiếu FMS và STD (STD hiện đã đổi mã chứng khoán thành SAN). Dòng đầu tiên dành cho ETF TZA và được đọc như sau: message

được ghi nhận tại 33219784 ms kể từ nửa đêm (09:13:39.784), với số ID lệnh là 4889087, LO là LO được niêm yết để mua (B) cho 1.900 cổ phiếu với giá $34,58 (tất cả giá đều tính bằng đô la $\times:10.000$). Số 1 trong cột cuối cùng biểu thị mã thị trường cho NASDAQ

Đối với QQQQ, chúng ta quan sát thấy một LO bị hủy (hàng 3), tiếp theo là việc đăng một LO bán (4), một LO khác bị hủy (5), một LO bán thứ hai được đăng (6)

1 Thông tin này thường bị thiếu trong nguồn cấp dữ liệu công khai.

và LO thứ ba bị hủy (7). Các lệnh bán đã đăng bao gồm số lượng và giá cho các lệnh (2.000 lệnh ở mức $45,48 và 500 lệnh cũng ở mức $45,48), trong khi các lệnh bị hủy phải được khớp với các lệnh đã đăng ban đầu (ID 4879130 và 4882599) để xác định giá và số lượng tương ứng. Chúng ta thấy cùng một mô hình đối với việc thực hiện đầy đủ lệnh ID 4888889 đối với STD (8) tức là không có giá hoặc số lượng ~ trong khi đối với FMS (2), chúng ta thấy việc hủy một phần 200 đơn vị từ lệnh ID 4887036 (giá cần được đọc từ lệnh đã đăng ban đầu)).

Từ dữ liệu này, người ta có thể xây dựng lại toàn bộ sổ lệnh tại bất kỳ thời điểm nào và nghiên cứu cách thị trường thay đổi theo thời gian bằng các biến số và phương pháp khác nhau. Bây giờ, chúng tôi sẽ trình bày tóm tắt về một số đặc điểm mà chúng tôi quan sát được.

3.1.2 Giá tài sản hàng ngày và lợi nhuận

Khi giao dịch, biến số quan tâm đầu tiên là mức giá. Nếu chúng ta phải mua/thanh lý một vị thế, chúng ta muốn biết mức giá có thể đạt được nếu thực hiện một cách quyết liệt, và nếu chúng ta đang cung cấp thanh khoản, chúng ta muốn biết giá cổ phiếu đang được mua và bán.

Như đã thảo luận trong Phần 1.2, mỗi nhà đầu tư tham gia thị trường để đạt được một mục tiêu nào đó và sẽ tham gia miễn là họ cảm thấy mình không mất quá nhiều tiền trong quá trình theo đuổi mục tiêu (ví dụ: nếu chi phí giao dịch không tiêu tốn mức tăng giá dự kiến, hoặc nếu thị trường điều chỉnh giá theo lệnh của họ, loại bỏ sai lệch định giá ban đầu mà họ muốn hưởng lợi - chúng ta sẽ thảo luận về những điều này bên dưới). Quá trình giá quan sát được là kết quả của sự tương tác giữa các nhà đầu tư này. Trên thị trường điện tử, chúng ta thấy những mức giá này liên tục khi các nhà giao dịch thay đổi vị thế để đạt được mục tiêu của họ nhằm ứng phó với những thay đổi về điều kiện thị trường và luồng thông tin. Các lý thuyết về hiệu quả thị trường cho chúng ta biết rằng quá trình giá kết quả là không thể dự đoán được và bất kỳ lợi nhuận kỳ vọng dương nào mà bạn có thể dự đoán được đều là một khoản bù đắp cho việc chịu rủi ro. Do đó, các nhà đầu tư dài hạn nhận được khoản bù đắp cho rủi ro, có thể là rủi ro thị trường, rủi ro từ những thay đổi chính sách tiền tệ, hoặc chỉ là khoản bù đắp cho biến động giá trong tương lai và sự không chắc chắn về cổ tức. Các nhà cung cấp thanh khoản cũng yêu cầu bồi thường: họ yêu cầu bồi thường cho việc giữ nguyên giá chào mua và giá chào bán, và sẽ tiếp tục đặt lệnh khi giao dịch của họ có đủ lợi nhuận. Các nhà giao dịch khác theo đuổi các chiến lược nhằm khai thác sự chênh lệch so với hiệu quả thị trường, chẳng hạn như giữ giá của các tài sản tương tự gần nhau. Cho dù người ta có tin vào hiệu quả thị trường hay không, các đặc tính của giá

quá trình này có thể phân tích được và trong chương này chúng ta sẽ xem xét một số phương pháp và kết quả thu được từ dữ liệu tin nhắn chi tiết cho các tài sản cụ thể.

Chúng tôi phân tích các đặc điểm của quá trình định giá cho một số tài sản được lựa chọn từ thị trường chứng khoán. Trọng tâm chính của chúng tôi là giá cổ phiếu AAPL (Apple Inc.) năm 2013, đại diện cho một tài sản có tính thanh khoản cao và được giao dịch rất nhiều. Để minh họa sự khác biệt giữa các tài sản, chúng tôi xem xét ba tài sản khác với mã chứng khoán ISNS, FARO và MENT: ISNS là công ty Image Sensing Systems, Inc. Ngành (Phần mềm ứng dụng)

ware); FARO là FARO Technologies Inc. (Thiết bị khoa học và kỹ thuật) và MENT là Mentor Graphics Corp. Ngành (Phần mềm hệ thống và kỹ thuật) Tất cả các tài sản này đều thuộc lĩnh vực công nghệ và đại diện cho các cấp độ hoạt động giao dịch khác nhau (mặc dù tùy thuộc vào định nghĩa của bạn, bạn có thể tranh luận về việc AAPL là công ty công nghệ hay công ty hàng tiêu dùng).

3.1.3 Hoạt động giao dịch hàng ngày

Trong Bảng 3.1, chúng ta có thể thấy các biện pháp khác nhau về hoạt động giao dịch đối với các tài sản này: số lượng giao dịch trung bình mỗi ngày trên NASDAQ N $N$ $(N)$, tổng giá trị đô la trung bình hàng ngày của các cổ phiếu được giao dịch trên NASDAQ ( $V(\mathfrak{S})$, tính bằng nghìn), số lượng cổ phiếu được giao dịch trung bình hàng ngày trên NASDAQ ( $V(Q)$, tính bằng nghìn), tổng số lượng cổ phiếu được giao dịch trung bình trên tất cả các thị trường (Tổng $V(Q)$, tính bằng nghìn) và doanh thu cổ phiếu (Doanh thu). Doanh thu cổ phiếu thể hiện tổng số cổ phiếu được giao dịch trong năm 2013 chia cho số lượng cổ phiếu đang lưu hành - cũng có trong Bảng 3.1 (ShrOut, tính bằng triệu, tính đến ngày 30 tháng 12 năm 2012). Từ cột có số giao dịch $(N)$ N $\Lambda^{\prime}$ và sử dụng thực tế là thị trường thông thường mở cửa trong 6,5 giờ (từ 9:30 đến 16:00), chúng ta có thể kết luận rằng ISNS là một tài sản rất hiếm khi được giao dịch (giao dịch khoảng một lần mỗi nửa giờ vào năm 2013), trong khi FARO và MENT là các tài sản nhỏ thông thường (trung bình từ 1 đến 3 giao dịch mỗi phút vào năm 2013) và AAPL là một trong những cổ phiếu được giao dịch nhiều nhất (khoảng 1 giao dịch mỗi giây - lưu ý rằng chúng tôi đang sử dụng dữ liệu năm 2013 và những con số này không được điều chỉnh lại để tính đến việc chia tách AAPL theo tỷ lệ 7:1 vào ngày 2 tháng 6 năm 2014).

Tài sản $N$$V($$)$(\lần 10^{3})$$V(Q)$$(\lần 10^{3})$Tổng$V(Q)$$(\lần 10^{3})$Hết hạn$(\lần 10^{6})$ Vòng quay ISNS 14 18 3 12 5 0,62 FARO 315 1.396 34 137 17 2,04 MENT 908 3.964 204 694 112 1,56 AAPL 24.582 1.505.175 3.208 14.516 941 3,89

Bảng 3.1 Khối lượng trung bình hàng ngày năm 2013 đối với một số tài sản được chọn.

Mẫu hình này được lặp lại bất kể bạn xem xét phép đo khối lượng nào trong Bảng 3.1 và liệu chỉ đo cho thị trường NASDAQ hay cho tất cả các thị trường cùng nhau.

3.1.4 Khả năng dự đoán giá hàng ngày

Đầu tiên, chúng ta xem xét các đặc tính của quá trình giá bằng cách xem xét lợi nhuận được xây dựng từ những thay đổi về giá từ khi thị trường mở cửa đến khi thị trường đóng cửa cho mỗi ngày trong năm 2013. Theo giả thuyết thị trường hiệu quả, lợi nhuận tài sản hàng ngày phải gần như không thể đoán trước và phản ánh thông tin trên thị trường. Để điều tra

Trong bài này, chúng tôi chạy hồi quy bình phương tối thiểu thông thường (OLS) để tính lợi nhuận trong ngày (từ lúc mở cửa đến lúc đóng cửa) cho bốn tài sản của chúng tôi. Chúng tôi bao gồm một số biến liên quan đến hiệu quả thị trường và các lực lượng thị trường như sau:

Biến số đầu tiên trong số này là lợi nhuận của SPY: SPY là một quỹ giao dịch trên sàn (ETF) theo dõi chỉ số S&P500. Trong tiểu mục 1.1, chúng ta đã thảo luận về ETF trong bối cảnh các loại tài sản khác nhau trên thị trường, và thấy rằng SPY là một tài sản được giao dịch trên các sàn giao dịch, giống như ISNS, FARO MENT và AAPL. Khi mua SPY, chúng ta mua một quỹ (tương tự như quỹ tương hỗ hoặc quỹ hưu trí) có mục tiêu là theo dõi S&P500 với chi phí thấp nhất có thể. Do đó, nhiều nhà đầu tư chỉ muốn giá trị khoản đầu tư của mình biến động theo "thị trường" (được biểu thị bằng S&P500) thường thích mua SPY hơn là đầu tư vào quỹ tương hỗ dựa trên cổ phiếu. Hơn nữa, các nhà giao dịch thích mua SPY hơn là mua tất cả 500 tài sản trong chỉ số, vì việc này (rẻ hơn nhiều) và loại bỏ chi phí liên quan đến việc liên tục tái cân bằng danh mục đầu tư để phù hợp với những thay đổi về tỷ trọng mà các tài sản khác nhau đại diện trong S&P500. Chi phí để thực hiện việc này, nhưng hiệu quả, đã được tích hợp vào SPY.

Một biến số khác là chỉ số biến động VIX: VIX là một chỉ số được công bố liên tục bởi Sàn Giao dịch Quyền chọn Chicago (CBOE), được thiết kế để đo lường kỳ vọng của thị trường về biến động ngắn hạn trong tương lai của chỉ số S&P500 - chỉ số này được tính bằng cách lấy một mức trung bình có trọng số nhất định của các quyền chọn ngắn hạn trên chỉ số S&P500. Chỉ số này được sử dụng làm đại diện cho sự bất ổn của thị trường, tâm lý nhà đầu tư, khẩu vị rủi ro của thị trường (lòng e ngại rủi ro thị trường) và các khái niệm liên quan khác. Có các quỹ ETF cố gắng theo dõi VIX, có các hợp đồng tương lai được hỗ trợ bởi VIX, và có các quyền chọn dựa trên chỉ số.

Biến số quan trọng thứ ba là luồng lệnh. Theo luồng lệnh, chúng ta muốn nói đến sự khác biệt giữa số lượng cổ phiếu được mua vào mạnh mẽ và số lượng cổ phiếu được bán ra mạnh mẽ. Đương nhiên, trên thị trường, với mỗi giao dịch đều có người mua và người bán. Tuy nhiên, trên thị trường điện tử, chúng ta có thể phân biệt giữa lệnh giới hạn được niêm yết (LO) và lệnh thị trường được thực hiện (MO). Do đó, nếu một giao dịch là kết quả của một lệnh bán giới hạn thụ động bị dỡ bỏ (bị đánh trúng) bởi một lệnh mua (bán) thị trường mạnh mẽ, chúng ta gọi đó là lệnh mua (bán) mạnh mẽ. Một lệnh mua (bán) mạnh mẽ được thúc đẩy bởi mong muốn mua (bán) nhanh chóng của một nhà giao dịch nào đó và biểu thị nhu cầu (cung) cổ phiếu của tài sản này so với cung/cầu chung trên thị trường. Do đó, luồng lệnh là đại diện cho nhu cầu ròng đối với tài sản, như chúng ta đã thấy trong Chương 2, có thể kết hợp thông tin liên quan đến các chiến lược tạo lập thị trường và biến động giá trong tương lai.

$$\begin{thu thập} T_{t,j} \\ (3.1) \\ r_{t,j} \\ +\beta_{6,j}:\mathrm{SPY}_{t}:1_{\mathrm{SPY}_{t}<0}+\beta_{7,j}:\mathrm{VIX}_{t}:1_{\mathrm{VIX}_{t}<0}+\epsilon_{t,j}. \end{thu thập}$$

Mô hình đầu tiên (3.1) (M1 trong Bảng 3.2) là hồi quy OLS cho lợi nhuận trong ngày của mỗi một trong bốn cổ phiếu của chúng tôi, trong đó $r_{t,j},j\in{$ ISNS, FARO, MENT, AAPL} Lợi nhuận được tính bằng giá của cổ phiếu khi đóng cửa thị trường trừ đi giá của cổ phiếu khi mở cửa thị trường, chia cho giá của cổ phiếu khi mở cửa thị trường: $r:=:\frac{P_{\mathrm{close}}-P_{\mathrm{open}}}{P_{\mathrm{oputa}}}$ . Mô hình bao gồm các biến ở vế phải:

(i) o: hằng số thể hiện lợi nhuận trung bình hàng ngày và phải gần bằng không, (i) $T_{t-1,j}$: lợi nhuận trong ngày của ngày hôm trước (không đáng kể vì lợi nhuận không thể dự đoán được), (ii) SPY: lợi nhuận trong ngày đồng thời trên SPY được tính giống như lợi nhuận trong ngày của cổ phiếu. (iv) VIX $t$: 'lợi nhuận' trong ngày đồng thời trên VIX được tính giống như lợi nhuận trong ngày của cổ phiếu (v) $\log(1+Q_{t})$ logarit của một cộng với số lượng cổ phiếu được giao dịch trên tất cả các thị trường trong ngày đó (chúng ta cộng thêm một để khi không có cổ phiếu nào được giao dịch, chúng ta không phải xử lý $\log(0)$ ) ， (vi ） OF $t$: lệnh cho luồng cổ phiếu trên NASDAQ vào ngày hôm đó.

Ngoài ra, mô hình thứ hai (3.2) (M2 trong Bảng 3.2) bao gồm các biến trong mô hình thứ nhất (M1), cộng với lợi nhuận của SPY và VIX nhân với các chỉ số, bằng 1 vào những ngày VIX hoặc NASDAQ giảm, và bằng 0 vào những ngày ngược lại. Hai biến này cho phép chúng tôi xác minh xem có phản ứng bất đối xứng nào về lợi nhuận của tài sản trước bất kỳ tin tức *tốt' hay *xấu' nào trên thị trường (hoặc sự biến động của nó) hay không.

Các mô hình được điều chỉnh trong Bảng 3.2 thể hiện các ước lượng OLS mạnh mẽ. Ước lượng OLS mạnh mẽ rất giống với phép tối thiểu hóa tổng bình phương phần dư theo OLS tiêu chuẩn, tức là tối thiểu hóa tổng bình phương khoảng cách giữa các quan sát và các giá trị được điều chỉnh. Sự khác biệt chính giữa OLS tiêu chuẩn và OLS mạnh mẽ là với OLS mạnh mẽ, các sai số trong ước lượng được điều chỉnh trọng số để giảm tác động của các giá trị ngoại lai lên các tham số ước lượng. Để có được các ước lượng trong Bảng 3.2, việc điều chỉnh trọng số được thực hiện lặp đi lặp lại và sử dụng hàm mất mát Huber, hàm này phạt các sai số lớn theo phương pháp tuyến tính thay vì phương pháp bậc hai. Bạn có thể tìm thấy thêm thông tin chi tiết về OLS và OLS mạnh mẽ trong bất kỳ sách giáo khoa kinh tế lượng tiêu chuẩn nào, ví dụ: xem Greene (2011) hoặc Cameron & Trivedi (2005).

Biến	ISNS	FARO	MENT	AAPL
hằng số	0,25	0,27	-2,83	-2,92
$r_{t-1,j}$	-0,10	-0,09	0,06	-2,97
GIÁM SÁT (%)	-0,60	-1,36	1,04	1,03
VIX (%)	-0,08	-0,01	-0,03	-0,05
Log Q	0,01	0,00	0,25	0,27
Luồng lệnh	0,03	0,02	0,05	0,05
Gián điệp Negv	—	1.43	—	—
Negv VIX	—	-0,19	—	—
Điều Chỉnh R	0,01	0,01	0,17	0,27

Bảng 3.2 Hồi quy OLS mạnh mẽ của lợi nhuận trong ngày (mở cửa đến đóng cửa). (In đậm: có ý nghĩa $5%$

Như Bảng 3.2 cho thấy, kết quả OLS đối với ISNS giao dịch thưa thớt phản ánh rất nhiều nhiễu (theo nghĩa là R bình phương ("adj R") rất gần với 0) và ý nghĩa của các hệ số không thực sự đáng tin cậy. Đối với các tài sản khác, chúng tôi thấy rằng hồi quy OLS thu thập được một số thông tin và có một biến luôn có ý nghĩa đối với ba tài sản còn lại, đó là dòng lệnh. Hệ số này có ý nghĩa và dương đối với cả ba tài sản, cho thấy dòng lệnh NASDAQ và lợi nhuận của tài sản di chuyển cùng nhau, điều này phù hợp với cách giải thích dòng lệnh là nhu cầu ròng của thị trường đối với tài sản và các mô hình thanh khoản của Glosten và Milgrom, và Kyle. Chúng tôi kỳ vọng hằng số và lợi nhuận của ngày hôm trước là không đáng kể và chúng tôi thấy trường hợp đầu tiên là đúng, và trường hợp sau là đúng đối với FARO và MIENT. AAPL thể hiện hệ số tự tương quan âm trong lợi nhuận hàng ngày, cho thấy một thành phần hồi quy trung bình đáng kể trong quá trình hoàn vốn, điều này không phù hợp với giả thuyết thị trường hiệu quả và cung cấp bằng chứng về động lượng ngắn hạn (âm), mặc dù trong tài liệu về cấu trúc vi mô (Roll (1984)), sự hiện diện của hệ số tự tương quan âm cũng có thể được giải thích theo thuật ngữ "giá mua-giá bán bật lên" - tức là các giao dịch không diễn ra ở 'giá thị trường' mà đúng hơn là một giao dịch mua tích cực phải vượt qua mức chênh lệch khác không để khớp với giá mua và thực hiện theo LO đứng ở đó, tại giá mua. Cuối cùng, chúng tôi thấy rằng trong năm 2013, lợi nhuận tài sản² của chúng tôi không bị ảnh hưởng đáng kể bởi những thay đổi trong tâm lý thị trường (được đo lường thông qua VIX). FARO và MENT có mức độ tiếp xúc đáng kể với biến động thị trường, mặc dù AAPL (hơi ngạc nhiên) dường như không bị ảnh hưởng. Chúng tôi cũng không tìm thấy bằng chứng đáng kể nào cho thấy có sự bất đối xứng giữa tin tức 'tốt' và 'xấu' từ các biến động trên thị trường hoặc trong tâm lý thị trường

Hình 3.1 Phân phối mẫu và biểu đồ QQ của lợi nhuận l-giây của AAPL vào ngày 30 tháng 7 năm 2013.

3.2 Giá tài sản và lợi nhuận trong ngày

Thông tin thị trường hàng ngày chỉ được quan tâm chủ yếu bởi các nhà đầu tư có tầm nhìn trung và dài hạn, nhưng các chiến lược giao dịch tần suất cao được thực hiện trong khoảng thời gian rất ngắn, vì vậy chúng ta cần xem xét diễn biến thị trường một cách chi tiết hơn. Để làm được điều này, chúng tôi sử dụng dữ liệu ITCH ở cấp độ tin nhắn, được đóng dấu mili giây cho thị trường NASDAQ để nghiên cứu giá trong nhiều giai đoạn lấy mẫu.

Tập trung vào AAPL và chỉ trong một ngày, ngày 30 tháng 7 năm 2013, chúng tôi xây dựng lợi nhuận tài sản theo từng khoảng thời gian một giây. Việc lựa chọn ngày là tùy ý. Đó là một ngày có mức tăng giá dương nhỏ và lưu lượng lệnh ròng dương: có 1,45 triệu cổ phiếu được mua so với 1,24 triệu cổ phiếu được bán trên NASDAQ, và giá tăng từ lúc mở cửa thị trường (449,96 đô la) đến lúc đóng cửa thị trường (453,32 đô la) là 3,36 đô la (+74 điểm cơ bản). Lợi nhuận của tài sản được tính bằng cách sử dụng giá vi mô. Giá vi mô $(S_{t}^{*})$

còn được gọi là giá trung bình có trọng số, là giá trung bình có trọng số của giá thầu tốt nhất $(P_{t}^{b})$ và giá chào bán tốt nhất ( $P_{t}^{\mathrm{Dd}}$ ), được trọng số bởi số lượng tương đối được đăng tại giá thầu ( $V_{t}^{b}$ và giá chào bán ( $V_{t}^{a}$ ) ：

$$\boxed{\quad S_t^*=\frac{V_t^b}{V_t^b+V_t^a}P_t^a+\frac{V_t^a}{V_t^b+V_t^a}P_t^b:.}$$

Giá vi mô tương tự như giá trung bình, nhưng nó kết hợp thông tin về sự mất cân bằng lệnh: ví dụ, số lượng lệnh mua tương đối lớn hơn trên giá thầu so với giá chào bán cho thấy áp lực mua lớn hơn và giá ^thực' gần với giá chào bán hơn là giá chào mua (giá vi mô đã được thảo luận ở cuối Chương 1, Chương 12 dành riêng cho các chiến lược giao dịch sử dụng sự mất cân bằng khối lượng trong LOB như một biến số chính trong các quyết định giao dịch, chính sự mất cân bằng khối lượng này khiến giá vi mô dịch chuyển về phía giá chào bán hoặc giá chào mua). Việc lựa chọn tần suất lấy mẫu rất quan trọng vì nó có ý nghĩa rất lớn

ảnh hưởng đến các đặc tính của phân phối thực nghiệm về lợi nhuận của tài sản. Nếu tần suất lấy mẫu rất ngắn thì nhiều quan sát sẽ bằng

Hình 3.2 Biểu đồ đuôi (thang logarit) của AAPL vào ngày 30 tháng 7 năm 2013.

bằng không. Trong ví dụ của chúng tôi, chúng tôi lấy mẫu ở tần suất một giây và thấy rằng đối với AAPL vào ngày 30 tháng 7 năm 2013, $33%$ lợi nhuận bằng không.

Chúng tôi thực hiện phân tích bằng cách sử dụng lợi nhuận, và chúng tôi sử dụng điểm cơ sở (bps) làm đơn vị phân tích (tức là, giá trị 1 trong Hình 3.1 biểu thị sự thay đổi 1/100 điểm phần trăm trong giá vi mô). Trong mẫu của chúng tôi, giá vi mô trung bình là $454,30, do đó, lợi nhuận dương 1 bps biểu thị mức tăng 4,5 cent trong giá vi mô, và 0,22 bps tương đương với 1 tick, tức là một cent. Nhìn vào biểu đồ tần suất của lợi nhuận 1 giây ở bảng bên trái của Hình 3.1, chúng tôi thấy rằng phân phối là một đỉnh đơn và dường như có đuôi béo. Điều này được xác nhận bởi biểu đồ QQ ở bảng bên phải của Hình 3.1. Đuôi béo thể hiện bởi lợi nhuận tài sản thường xảy ra khi lấy mẫu tại

Các khoảng thời gian ngắn, nhưng có thể tồn tại ở tần số dài hơn. Hình 3.2 phóng to phần đuôi phải và trái. Cụ thể, chúng tôi sử dụng các giá trị lợi nhuận trên phần trăm thứ 95 (1,94 điểm cơ bản) và dưới phần trăm thứ 5 (-1,94 điểm cơ bản) để xác định các đuôi này. Lấy các giá trị ngưỡng này làm giá trị cho trước, chúng tôi giả định các đuôi tuân theo luật lũy thừa với hàm phân phối xác suất được cho bởi $f(r)$, trong đó

$$f(r)=\frac{\alpha-1}{r_{\min}}:\left(\frac{r}{r_{\min}}\right)^{-\alpha}:,$$

và ước tính tham số $d$ bằng cách sử dụng ước lượng khả năng tối đa (MLE). MLE cho $0x$ có thể được chứng minh là (xem, ví dụ, Clauset, Shalizi $8z$ Newman (2009))

$$\hat{\alpha}=1+T\left[\sum_{t=1}^T\log\left(\frac{r_t}{r_{\min}}\right)\right]^{-1}.$$

Sử dụng các ngưỡng cắt đã cho, các ước lượng này cho chúng ta $\ddot{\alpha}{\mathrm{right}}=3,35$ và $\hat{\alpha}{\mathrm{left}}=3,38$. Độ phù hợp của mô hình đuôi tương ứng với các đường đứt nét màu đen trong Hình 3.2 và cho thấy lợi nhuận 1-giây có đuôi rất nặng. Để hiểu được liệu thị trường có hoạt động theo mô hình hiệu quả hay không

Giả thuyết thị trường, chúng tôi ước tính hàm tự tương quan (ACF) từ dữ liệu lợi nhuận. Nhớ lại rằng ACF $f(n)$ được xác định bởi tương quan của $Tt-n$ với $Tt$

Hình 3.3 Mẫu ACF về lợi nhuận 1 giây của AAPL vào ngày 30 tháng 7 năm 2013.

và có thể được ước tính từ tương quan mẫu. ACF mẫu cho APPL vào ngày 30 tháng 7 năm 2013 được hiển thị ở bảng bên phải của Hình 3.3. Điều này cho thấy tự tương quan âm và có ý nghĩa đối với độ trễ đầu tiên, cho thấy một thành phần đảo ngược giá trị trung bình đáng kể trong giá vi mô. Chúng tôi cũng thấy rằng độ trễ thứ 12 có ý nghĩa (yếu) và dương, trong khi độ trễ thứ 14 có ý nghĩa và âm. Không có lý do lý thuyết mạnh mẽ nào để quan sát các mô hình như vậy, vì vậy nếu không có nghiên cứu sâu hơn, chúng tôi không thể chắc chắn liệu đây có phải là một mô hình giả mạo xuất hiện vào ngày cụ thể này hay là một điều gì đó thực sự có ý nghĩa.

3.3 Thời gian giữa các lần đến

Chúng ta đã thấy rằng ngay cả ở khoảng thời gian một giây, 33% thời gian không có thay đổi giá. Khi tần suất lấy mẫu giảm dần, việc mô hình hóa các mức giá quan sát được như một quá trình liên tục trở nên ngày càng khó khăn, và chúng ta cần xem xét các quá trình rời rạc. Chúng ta bắt đầu bằng cách xem xét thời gian đến giữa các biến động ở giá mua hoặc giá bán. Giả sử 712 biểu thị thời gian có sự thay đổi trong giá mua hoặc giá bán.

hỏi, và chúng ta xem xét tần suất của thời gian giữa các lần đến, $X_{i}=\tau_{i+1}-\tau_{i}$ Giá trị trung bình là 10,4 ms và trung vị là 3 ms. Hình 3.4 cung cấp thêm thông tin chi tiết: các bảng trên cùng mô tả biểu đồ histogram của $X_{i}$ theo thang tuyệt đối và thang logarit, trong khi bảng dưới cùng chứa biểu đồ QQ so với thang mũ (với cùng giá trị trung bình). Các biểu đồ này chỉ ra rằng thời gian giữa các lần đến có phân phối theo luật lũy thừa với các đuôi rất nặng. Chúng tôi ước tính tham số cho đuôi phải (như chúng tôi đã làm đối với lợi nhuận l-giây ở trên) và chúng tôi thu được MLE là $\hat{\alpha}=3,13$ cho lũy thừa bằng cách sử dụng phần trăm thứ 95 (41 ms) làm ngưỡng. Chúng tôi cũng xem xét ngắn gọn về động lực của quá trình giữa các lần đến. Hình 3.5

Mô tả ACF. Như đã trình bày, những thay đổi trong giá mua và giá bán không độc lập, nhưng có một thành phần tự tương quan mạnh. Điều này cho thấy một thực tế thực nghiệm thường thấy về những thay đổi như vậy, cụ thể là chúng tập hợp lại. Những thay đổi nhanh chóng trong giá mua/giá bán được theo sau bởi những thay đổi nhanh chóng hơn nữa, trong khi một giai đoạn bình lặng tương đối dài cũng được theo sau bởi một giai đoạn bình lặng khác.

Hình 3.4 Biểu đồ tần suất thời gian giữa các lần đến $(X)$ theo thang đo tuyệt đối và thang đo logarit cho AAPL vào ngày 30 tháng 7 năm 2013. Bảng dưới cùng mô tả biểu đồ QQ liên quan đến phân phối mũ và phân phối theo luật lũy thừa: $\mathbb{P}\left(X_{i}\leq x\right)=1-(k/x)^{\alpha}.$

Hình 3.5 Biểu đồ hàm tự tương quan cho thời gian giữa các lần đến (AAPL, ngày 30 tháng 7 năm 2013).

Độ trễ và Kích thước Tích tắc

Giả sử chúng ta muốn thực hiện một giao dịch, ví dụ: mua 1.000 cổ phiếu AAPL. Sự đánh đổi đầu tiên chúng ta phải đối mặt là tính tức thời so với chi phí thực hiện. Nếu bạn lo ngại về tính tức thời, cách nhanh nhất để thực hiện giao dịch là vượt qua mức chênh lệch giá và thực hiện càng nhiều càng tốt bằng lệnh thị trường (MO). Tuy nhiên, bất kỳ tác nhân nào coi trọng tính tức thời đều cần lưu ý một vấn đề mới: độ trễ tin nhắn. Độ trễ đề cập đến độ trễ giữa việc gửi tin nhắn đến

thị trường và việc nó được sàn giao dịch tiếp nhận và xử lý. Đôi khi, thời gian sàn giao dịch xác nhận đã nhận được tin nhắn cũng được cộng vào. Độ trễ là ngẫu nhiên và phụ thuộc vào nhiều yếu tố như khoảng cách giữa người gửi và sàn giao dịch, cấu trúc và loại mạng, số lượng lệnh trong mạng (có thể gây ra tắc nghẽn), v.v. Ngoài ra, từ độ trễ được sử dụng phổ biến hơn để diễn tả thời gian cần thiết để một tin nhắn truyền từ điểm này đến điểm khác, chẳng hạn như độ trễ của nguồn cấp tin tức. Một ví dụ điển hình về độ trễ là thời gian cần thiết để một tin nhắn truyền từ sàn giao dịch quyền chọn Chicago (hay đúng hơn là trung tâm đặt máy chủ CME) đến New York (hay đúng hơn là trung tâm xử lý của NASDAQ tại New Jersey). Độ trễ giữa hai trung tâm này được ước tính là từ 7,5 đến 6,7 ms khi truyền bằng cáp quang, hoặc từ 4,2 đến 5,2 ms khi truyền bằng sóng vi ba (vào những ngày trời quang). Nếu một đại lý giao dịch tại nhà, thông qua một nhà môi giới, cô ấy phải nhận thức được

Độ trễ đáng kể giữa thời điểm cô ấy yêu cầu nhà môi giới thực hiện lệnh và thời điểm lệnh đến thị trường. Trong thời gian đó, điều kiện thị trường có thể đã thay đổi rất nhiều. Tuy nhiên, nếu đại lý giao dịch trực tiếp thông qua nguồn cấp dữ liệu của nhà môi giới hoặc cô ấy có nguồn cấp dữ liệu riêng của mình vào thị trường, độ trễ sẽ ngắn hơn nhiều, mặc dù vẫn đáng kể so với các trung tâm đặt chung máy chủ. Đặt chung máy chủ, còn được gọi là đặt máy chủ, có nghĩa là hệ thống giao dịch của đại lý được đặt tại trung tâm dữ liệu của sàn giao dịch điện tử và có kết nối trực tiếp với công cụ khớp lệnh của sàn. Về nguyên tắc, những người đặt chung máy chủ sẽ phải đối mặt với độ trễ tương tự nhau, mặc dù vẫn sẽ có một số độ trễ tùy thuộc vào cấu hình phần mềm và phần cứng của họ (việc đặt chung máy chủ cũng đã được thảo luận trong Chương 1). Độ trễ là một vấn đề đối với các đại lý vì một số lý do. Một đại lý đang giao dịch

Thường xuyên và trong phạm vi hẹp, cần phải nắm rõ tình hình thị trường và có khả năng điều chỉnh lệnh của mình, ví dụ như đăng lệnh mới, hủy lệnh LO hiện có, hoặc gửi lệnh MO. Hơn nữa, khi thực hiện lệnh MO, một đại lý cần nhận thức được mối quan hệ giữa lựa chọn chiến lược định tuyến của mình và cách các nhà giao dịch khác có thể phản ứng với thông tin có thể được rút ra từ việc quan sát kết quả của chiến lược. Một lệnh MO lớn, định tuyến kém sẽ báo hiệu tiến trình của nó qua nhiều sàn giao dịch, dẫn đến chất lượng thực hiện kém và chi phí thực hiện cao, vì các nhà giao dịch khác sẽ định vị lại vị thế của mình để hấp thụ lệnh ở mức giá thuận lợi hơn (đối với họ). Đối với một số tài sản, hoàn cảnh thay đổi rất nhanh, trong khi đối với những tài sản khác, thị trường

khá ổn định. Chúng ta thấy điều này trong biến động giá và chênh lệch giá trong Bảng 3.3 và 3.4. Bảng 3.3 ghi lại những thay đổi chậm chạp của các tài sản ít được giao dịch, chẳng hạn như ISNS, FARO hoặc MENT. Bảng 3.4 xem xét các cổ phiếu được giao dịch thường xuyên hơn, AAPL và ORCL. Bảng 3.3 xem xét diễn biến của chênh lệch giá mua/bán/giá trung bình/giá niêm yết từ

Thời gian chờ từ phút này sang phút tiếp theo đối với ba tài sản: ISNS, FARO và MENT. Độ trễ một phút là một khoảng thời gian rất dài đối với một nhà giao dịch, và bạn sẽ không mong đợi sự chậm trễ như vậy trừ khi bạn giao dịch qua kết nối rất chậm đến sàn giao dịch (hoặc lệnh không được chuyển trực tiếp đến sàn giao dịch). Chúng ta thấy điều này trong cột đầu tiên của

Bảng 3.3 Thay đổi trong một phút về chênh lệch giá mua, giá bán, giá trung bình và giá niêm yết.

Bảng 3.3 (được ký hiệu là $\Delta X\neq0$), trong đó chúng ta tìm thấy tỷ lệ phần trăm số phút mà chênh lệch giá mua/giá bán/giá trung bình/giá niêm yết khác nhau (khác không). Đối với ISNS, chúng ta quan sát thấy chỉ có 4,2 phần trăm thời gian giá mua thay đổi từ phút này sang phút khác. Trong các cột liền kề, chúng ta có thể thấy số liệu thống kê cho những phút mà biến quan tâm thay đổi. Từ những số liệu này, chúng ta có thể kết luận rằng trong một nửa thời gian giá mua của ISNS thay đổi, nó dao động giữa mức tăng 5 xu (Q3) và mức giảm 4 xu (Q1). Nếu chúng ta xem xét giá trung bình của ISNS, chúng ta thấy rằng nó chỉ thay đổi 6,7 phần trăm thời gian, và khi nó thay đổi, một nửa số thay đổi đó nằm giữa mức tăng 2 xu và mức giảm 2 xu. Mặt khác, nếu xét đến các tài sản như FARO hoặc MENT, sự chậm trễ một phút sẽ dẫn đến những thay đổi trong giá chào mua (tương tự như giá chào bán) khoảng một nửa thời gian, cũng như (tất nhiên) trong chênh lệch giá trung bình và giá niêm yết. Lưu ý rằng đây là phân tích vô điều kiện cho tất cả các phút của năm 2013 và không tính đến việc các bên tham gia thị trường phản ứng với dòng lệnh. Ví dụ, nếu một người gửi lệnh mua thị trường, các đại lý khác có thể nhanh chóng điều chỉnh giá niêm yết của họ tăng lên để đáp ứng với thông tin mới này. Do đó, việc một tài sản có rất ít thông tin công khai (dưới dạng giao dịch/MO) như ISNS sẽ ít biến động giá hơn so với các tài sản được giao dịch thường xuyên hơn, như FARO hoặc MENT, là điều tự nhiên. Đây không phải là bức tranh tương tự mà chúng ta thấy khi xem xét các tài sản phổ biến nhất.

Cổ phiếu (xét về hoạt động). Các tài sản như AAPL và ORCL gần như chắc chắn sẽ có sự thay đổi giá trong vòng một phút, nhưng đối với những tài sản này, độ trễ một phút là quá dài theo bất kỳ tiêu chuẩn nào. Bảng 3.4 phản ánh cùng thông tin với Bảng 3.3 nhưng sau độ trễ 100 ms thay vì một phút (và trong ba tháng cuối năm 2013 thay vì cả năm). Ngoài ra, thay vì báo cáo số liệu thống kê cho toàn bộ mẫu, chúng tôi báo cáo giá trị trung vị cho các số liệu thống kê được tính toán ở cấp độ hàng ngày. Nghĩa là, sau khi tính toán phần trăm hàng ngày-

$\begin{array}{lllll}\text { Tài sản } & \text { Biến } & \Delta X \neq 0 & \text { Số liệu thống kê (cho } \Delta X \neq 0) & \ & & (%) & P 01 & Q 1 \ & & & Q 2 & Q 3 \ & AAPL & \text { Giá thầu } & 3,84 & -17,0 \ & & \text { Giá chào } & 4,00 & -18,3 \ & & \text { Giá trung bình } & 6,75 & -11,5 \ & & \text { Chênh lệch giá niêm yết } & 6,69 & -16,0\end{array}$

Bảng 3.4 Thay đổi trong một trăm ms của chênh lệch giá mua, giá bán, giá trung bình và giá niêm yết.

với khoảng thời gian 100 ms với những thay đổi giá thầu khác không đối với AAPL trong mỗi ngày từ tháng 10 đến tháng 12 năm 2013, chúng tôi báo cáo rằng giá trung vị của những thay đổi này là 3,84 đô la%$ Tương tự, sau khi tính toán tứ phân vị đầu tiên của những thay đổi giá thầu khác không trong mỗi ngày, chúng tôi báo cáo giá trung vị của những thay đổi này là -3 xu, trong khi giá trung vị của tứ phân vị thứ ba là mức tăng 3 xu.

Lưu ý rằng có sự khác biệt đáng chú ý về tần suất và mức độ thay đổi giá giữa AAPL và ORCL. AAPL có tần suất thay đổi thường xuyên hơn và mức độ thay đổi lớn hơn ORCL. Có hai yếu tố quan trọng ở đây: (i) khối lượng giao dịch (tính bằng đô la) của AAPL lớn hơn một bậc so với ORCL, nhưng (ii) giá của AAPL trong quý cuối cùng của năm 2013 nằm trong khoảng từ $$490$ đến $$560, trong khi giá của ORCL nằm trong khoảng từ $$32$ đến $$38$. Vì cả hai tài sản đều có cùng kích thước tick tối thiểu (một xu), điều này có nghĩa là AAPL có thể trải qua những thay đổi phần trăm nhỏ hơn nhiều về giá của nó (1 xu = 0,2 điểm cơ bản của $500 ) so với ORCL ($\mathrm{l~~cent~~=2,5}$ điểm cơ bản của $$40$). Do đó, người ta có thể mong đợi những biến động giá thường xuyên hơn đối với AAPL so với ORCL (ngay cả sau khi AAPL chia tách một cổ phiếu cũ thành bảy cổ phiếu mới, vì sau khi chia tách và giá AAPL vào khoảng $$100$, thì một thay đổi một xu tương đương với một thay đổi 1 điểm cơ bản, lớn hơn nhiều so với 2,5 bps của ORCL)

3.5 Bản chất phi Markovian của sự thay đổi giá

Trong phần này, chúng tôi sẽ nghiên cứu mối liên hệ giữa các biến động giá liên tiếp. Để làm được điều này, trước tiên chúng tôi xem xét liệu dấu hiệu của biến động giá hiện tại có thể dự đoán dấu hiệu của biến động giá tiếp theo (khác 0) hay không. Chúng tôi tiếp tục sử dụng AAPL vào ngày 30 tháng 7 năm 2013 để phân tích và ghi nhận các biến động giá mỗi khi chúng xảy ra. Trong Bảng 3.5, chúng tôi thấy rằng việc tăng giá (giá mua hoặc giá bán) thường dẫn đến sự đảo chiều, và tương tự như vậy đối với việc giảm giá.

Trong Bảng 3.5, chúng ta thấy rằng sự gia tăng giá chào bán (tăng đột ngột) được theo sau bởi sự giảm đột ngột 57% thời gian, trong khi sự giảm đột ngột của giá chào bán được theo sau bởi sự gia tăng

$t/t+1$ Hỏi Giá thầu Tăng (↑) Giảm (↓) Tăng (↑) Giảm (↓) Tăng (↑) 43,0 57,0 36,5 63,5 Giảm (↓) 61,8 38,2 55,3 44,7

Bảng 3.5 Tỷ lệ chuyển đổi theo kinh nghiệm: Thay đổi giá đơn lẻ.

61,8% thời gian. Đối với giá thầu, các con số là 63,5% và 55,3% thời gian. Trước đó, trong Bảng 3.4, chúng ta đã thấy rằng độ trễ 100 ms không dẫn đến thay đổi nào trong giá thầu trong hơn 96% thời gian (ít nhất là trong một nửa thời gian quan sát). Tuy nhiên, trong Phần 3.3, chúng ta đã thấy rằng thời gian trung bình giữa các lần đến của một thay đổi trong giá thầu hoặc giá chào bán là 3 ms (đối với giá thầu là 8 ms). Các con số trong Bảng 3.5 giúp chúng ta dung hòa hai tuyên bố có vẻ mâu thuẫn này: mặc dù sau độ trễ 100 ms, người ta có thể không quan sát thấy sự thay đổi ròng trong giá thầu, nhưng sự thay đổi ròng bằng không này là kết quả của cả việc không có thay đổi nào trong khoảng thời gian 100 ms và cũng là kết quả của một số thay đổi triệt tiêu lẫn nhau. Vì vậy, đối với độ trễ lớn hơn 8 ms, nếu bạn gửi một MO, thì khi nó được đưa ra thị trường, giá có thể đã di chuyển đi nhưng cũng có thể đã trở lại mức giá khi MO được gửi. Do đó, độ trễ gây ra rủi ro thực hiện, đặc biệt đối với các nhà giao dịch không cùng vị trí. Bảng 3.5 cũng minh họa sự bất đối xứng xuất hiện vào ngày này trong tương quan.

Tần suất đảo ngược giá. Sự bất đối xứng này cho thấy việc thu hẹp chênh lệch giá niêm yết (giá chào bán giảm hoặc giá chào mua tăng) có nhiều khả năng được đảo ngược hơn là việc tăng chênh lệch giá niêm yết (giá chào bán tăng hoặc giá chào mua giảm).

Vì vậy, chúng tôi trình bày Bảng 3.6 để nghiên cứu xem liệu dấu hiệu của sự thay đổi giá hiện tại có thể dự đoán được dấu hiệu của sự thay đổi giá trong hai giai đoạn tiếp theo hay không. Bảng này mô tả tần suất tương đối của sự đảo ngược giá (''Đảo ngược'', ↑↓ hoặc ↓↑) so với các chuyển động liên tiếp theo cùng một hướng (''Lên'(↑↑) và "Xuống'(↓↓)) có điều kiện là sự thay đổi giá hiện tại là tăng hoặc giảm ↓. Khoảng 60% các thay đổi liên tiếp trong giá thầu và giá chào bán theo hướng ngược nhau. Bảng 3.6 không chỉ cho thấy xác suất có điều kiện của hai biến động giá trong tương lai mà còn cho thấy cả biến động giá không điều kiện. Khi so sánh các chuyển đổi đó, chúng ta đi đến kết luận rằng dường như có rất ít hoặc không có sự khác biệt nào giữa các chuyển đổi có điều kiện và không điều kiện. Do đó, mặc dù các thay đổi giá có xu hướng bị đảo ngược, nhưng hướng thay đổi giá hiện tại (cho dù là tăng hay giảm) không mang thông tin bổ sung về các thay đổi giá trong tương lai. Cuối cùng, chúng ta xem xét một chuỗi thay đổi giá dài hơn, tức là chúng ta xem xét liệu

Dấu hiệu của hai lần thay đổi giá trước đó có thể dự đoán lần thay đổi giá tiếp theo. Để thực hiện điều này, chúng tôi định nghĩa bốn trạng thái, mỗi trạng thái cho mỗi cặp dấu hiệu thay đổi giá có thể xảy ra như sau: $A$ là một đợt tăng giá tiếp theo sau một đợt tăng giá khác ( $A=1\uparrow\uparrow$ ) , $b$ là một đợt tăng giá tiếp theo sau một đợt giảm giá ( $B=1/4$ ) , $C$ là một đợt giảm giá tiếp theo sau một đợt tăng giá ( $C=\downarrow\uparrow$ ) ，

Hỏi	Lên(t + 1, t + 2) (↑↑)	Đảo ngược(t + 1, t + 2) (↑↓, ↓↑)	Xuống(t + 1, t + 2) (↓↓)
Uplick(t) (↑)	17.1	59.5	23.4
Downlick(t) (↓)	19.6	59.1	21.3
Không điều kiện	18.3	59.3	22.4

Giá thầu	Lên(t + 1, t + 2) (↑↑)	Đảo ngược(t + 1, t + 2) (↑↓, ↓↑)	Xuống(t + 1, t + 2) (↓↓)
Uplick(t) (↑)	24.0	60.3	15.7
Downlick(t) (↓)	23.7	58.1	18.2
Không điều kiện	23.9	59.1	17.0
Bảng 3.6 Tỷ lệ chuyển đổi theo kinh nghiệm: Cặp thay đổi tích tắc.

và $D$ là một dấu giảm tiếp theo là một dấu giảm khác $(D=\psi$ ). Các dấu thay đổi giá sau đó được sử dụng để tạo ra một chuỗi $A$ ， $b$ ， $C$ ， $LD$ với các quan sát chồng chéo, do đó, ví dụ, chuỗi ↑↓↓↑ sẽ được biểu diễn là $BDC$ Lưu ý rằng có một số chuyển đổi không thể xảy ra. Ví dụ, $B$ không thể theo sau $A$ , vì nếu thay đổi giá là $B(\uparrow\downarrow)$ ， thì (i) thay đổi tiếp theo là介, trong trường hợp đó chúng ta chuyển sang trạng thái $C(\Downarrow\uparrow)$ , hoặc (ii) thay đổi tiếp theo là $\downarrow\downarrow$ , trong trường hợp đó chúng ta chuyển sang trạng thái $D(\Downarrow\downarrow)$ Tần suất chuyển đổi ước tính cho chuỗi Markov này được cung cấp trong

Bảng 3.7. Chuyển đổi $AA$ nên được hiểu là chuỗi các tick ↑个个价, $BC$ thành ↑↓↑, v.v. Trong bảng, chúng ta có thể thấy sự xác nhận về sự đảo chiều giá: các chuyển đổi $BC$ và $CB$ có xác suất cao hơn đáng kể, cho thấy các biến động giá liên tiếp (cả giá mua và giá bán) có xu hướng đi ngược chiều nhau.

3.6 Phân mảnh thị trường

Một vấn đề khác cần cân nhắc khi thực hiện giao dịch tích cực là sự phân mảnh thị trường. Chúng tôi chỉ đề cập sơ lược về vấn đề này ở đây, nhưng đây là mối lo ngại nghiêm trọng đối với các nhà giao dịch tần suất cao. Cho đến nay, chúng tôi đã tập trung vào dữ liệu chi tiết từ một sàn giao dịch, NASDAQ.

Tính đến tháng 10 năm 2014 tại Hoa Kỳ có 11 sàn giao dịch và khoảng 45 địa điểm giao dịch thay thế, hầu hết trong số đó là các nhóm giao dịch ngầm - nhóm giao dịch ngầm là các địa điểm giao dịch không công khai báo giá và vào năm 2014, NASDAQ chiếm khoảng 20 phần trăm giao dịch (sau này, trong phần 7.4, chúng tôi cung cấp các thuật toán thực hiện trong đó tác nhân có quyền truy cập vào thị trường sáng tiêu chuẩn và cả thị trường tối

$(t+1)$	A(↑)	B(↓)	C(↓)	D(↓)
A(t)(↑)	54,4	45,6	70,0	30,0
B(t)(↕)	-	65,6	0,0	0,0
C(t)(↗)	34,4	-	48,6	51,4
D(t)(↘)	-	-	-	-

$(t+1)$	A(↑)	B(↓)	C(↓)	D(↓)
A(t)(↑)	43.0	57.0	-	-
B(t)(↕)	-	67,2	62,2	37,8
C(t)(↗)	32,8	-	46,9	53,1
D(t)(↘)	-	-	-	-

Bảng 3.7 Tỷ lệ chuyển đổi theo kinh nghiệm: Cặp ve.

(pool). Vì vậy, chúng ta không thể thực sự nói về "thị trường" như một sàn giao dịch duy nhất, mà là sự tổng hợp hoạt động trên nhiều địa điểm. Để hiểu rõ mức độ phân mảnh thị trường, tức là mức độ thị trường của một tài sản được phân bổ trên các địa điểm khác nhau, chúng tôi xem xét giao dịch trong giờ giao dịch (9:30-16:00) của một tài sản, AAPL, vào ngày 30 tháng 7 năm 2013 trên tất cả các địa điểm, sử dụng dữ liệu Bảng tổng hợp. Dữ liệu này cung cấp thông tin về tất cả các giao dịch và báo giá tốt nhất từ tất cả các địa điểm. Ở đây, chúng tôi đã xây dựng lại giá chào mua và chào bán cho các địa điểm mà chúng tôi đã

Hoạt động của AAPL được báo cáo trong ngày hôm đó. Với giá mua và giá bán được tái tạo, chúng tôi tính toán tỷ lệ phần trăm thời gian giá tốt nhất của mỗi sàn giao dịch (giá mua hoặc giá bán) trùng khớp với giá tốt nhất trên tất cả các sàn. Bảng 3.8 thể hiện thông tin này. Chúng ta có thể thấy giá mua của NASDAQ-OMX trùng khớp với giá mua tốt nhất trên tất cả các sàn trong 67% giờ giao dịch thông thường, trong khi con số tương tự là 19% đối với BATS, 43% đối với NYSE-ARCA, 35% đối với EDGE-X và không bao giờ xảy ra đối với thị trường EDGE-A. Do đó, việc thực hiện giao dịch một cách tối ưu không chỉ là về thời điểm và giá cả.

được chơi trong một sàn giao dịch, mà còn về: cách tổ chức cách một lệnh (hoặc các lệnh) đến một địa điểm giao dịch cụ thể, các luật khác nhau chi phối cách các sàn giao dịch nên xử lý các lệnh là gì và các quy tắc mà các sàn giao dịch sử dụng để thực hiện chúng, cách lập trình định tuyến lệnh và loại lệnh nào phù hợp nhất với định tuyến và chiến lược giao dịch cụ thể của một người, v.v. Tại Hoa Kỳ, quy định cụ thể, Reg NMS (Hệ thống thị trường quốc gia), đã

được thiết lập để tạo điều kiện thuận lợi cho cạnh tranh giữa các sàn giao dịch và bảo vệ nhà đầu tư. Cụ thể, nó có các điều khoản cụ thể để bảo vệ lệnh của nhà đầu tư bằng cách ngăn chặn việc giao dịch xuyên biên giới (tức là thực hiện lệnh ở mức giá thấp hơn khi có giá tốt hơn, đặc biệt là khi giá đó đến từ một thị trường 'thích hợp' (được bảo vệ).

Phần trăm thời gian tại NBBO

Trao đổi	Đấu thầu	Hỏi mua
NASDAQ	67,8	61,3
Dơi	18.8	15.7
ARCA-NYSE	43,4	38,3
NSE	0.0	0.0
FINRA	0.0	0.0
CSE	0.0	0.0
CBOE	1,2	0,7
EDGA	0.0	0.0
EDGX	34,5	41,0
NASDAQ-BX	0.0	0.0
NASDAQ-PSX	0.0	0.0
Dơi-Y	4.5	0.0

Bảng 3.8 Tỷ lệ phần trăm thời gian giá tốt nhất của Sở giao dịch chứng khoán NBBO.

(báo giá tại một địa điểm giao dịch khác). Bảng 3.9 và 3.10 xem xét việc thực hiện giao dịch tại các địa điểm khác nhau và so sánh giá thực hiện giao dịch so với giá mua/bán tốt nhất trên sàn giao dịch mà giao dịch được báo cáo (Địa phương) và so với giá tốt nhất hiện có trên tất cả các địa điểm mà chúng tôi đã xây dựng lại từ dữ liệu (NBBO).

Tổng giá thầu trao đổi Tổng giá thầu địa phương Tổng giá thầu NBBO NASDAQ 22.214 8.122 30.336 458.994 367.181 188.407 824.675 Dơi 1.854 2.200 4.054 118.205 108.407 225.512 ARCA-NYSE 9.840 5.630 15.470 292.933 273.729 566.361 NSE 901 200 1.101 13.244 11.057 24.301 FINRA 0 0 0 534.178 406.346 940.424 CSE 0 0 0 0 0 0 0 CBOE 0 0 0 5.005 1.550 6.555 EDGA 0 100 100 31.357 22.125 53.482 EDGX 9.324 2.300 11.614 230.187 207.005 436.392 NASDAQ-BX 1.016 1.100 2.116 60.971 48.365 109.336 NASDAQ-PSX 0 100 100 600 1.525 2.125 Dơi-Y 100 1.000 1.100 16.519 16.178 32.497

Bảng 3.9 Số lượng cổ phiếu được thực hiện ở mức giá tốt nhất (Giá địa phương là giá tốt nhất tại sàn giao dịch địa phương nếu giá tốt nhất tại địa phương không phải là NBBO).

Bảng 3.9 so sánh đối với từng địa điểm, các lệnh thực hiện diễn ra ở mức giá tốt nhất trên tất cả các địa điểm (NBBO) so với các lệnh thực hiện ở mức giá tốt nhất tại địa điểm đó (Địa phương), khi mức giá tốt nhất của địa điểm đó không phải là tốt nhất trên tất cả các địa điểm. Chúng ta có thể

Bảng 3.10 Tỷ lệ cổ phiếu được thực hiện theo Chất lượng thực hiện.

thấy rằng khi giao dịch với giá tốt nhất, nó xảy ra so với NBBO hầu hết thời gian. Trong Bảng 3.10, chúng tôi cho phép các loại thực hiện khác, không chỉ so với giá tốt nhất, mà còn bên trong chênh lệch (Địa phương) (giữa giá mua và giá bán tốt nhất địa phương, trong khi không phải tại NBBO) và bên ngoài chênh lệch (đối với FINRA và CSE, chúng tôi sử dụng NBBO làm tham chiếu vì không có báo giá mua/bán địa phương nào được báo cáo). Các con số cho thấy rõ ràng rằng hầu hết tất cả các giao dịch đều diễn ra tại NBBO được tính toán hoặc bên trong chênh lệch (địa phương): lần lượt là 40 và 58 phần trăm đối với NASDAQ, 43 và 54 đối với NYSE-ARCA, 35 và 64 đối với BATS và 30 và 67 phần trăm đối với EDGEX. Các tỷ lệ phần trăm tương tự đối với các giao dịch được báo cáo cho FINRA lần lượt là 22 và 72 phần trăm khi sử dụng NBBO làm tham chiếu. Những con số này cho thấy chất lượng thực hiện lệnh khá cao, mặc dù tỷ lệ giao dịch trong phạm vi chênh lệch giá có vẻ lớn bất thường nếu xét đến việc một lệnh thị trường thông thường phải được thực hiện ở mức giá tốt nhất. Một lời giải thích khả dĩ là nhiều giao dịch trong số này được thực hiện dựa trên các lệnh ẩn được đặt trong phạm vi chênh lệch giá và/hoặc thông qua các loại lệnh thay thế cho phép đặt lệnh tích cực trong phạm vi chênh lệch giá.

3.7 Kinh nghiệm giao dịch theo cặp

Hầu hết các nhà giao dịch không xem xét từng tài sản một, mà xem xét sự tương tác giữa các tài sản khác nhau. Điều này hợp lý khi bạn có thể trích xuất thông tin từ sự tương tác giữa các tài sản khác nhau. Phương pháp này hiệu quả nhất với các nhóm tài sản có chung biến động và diễn ra tự nhiên đối với các tài sản trong cùng một ngành. Trong phần này, chúng ta sẽ tập trung vào sự tương tác giữa hai cổ phiếu công nghệ.

(Intel, INTC) và một quỹ ETF công nghệ (Merrill Lynch Semiconductor ETF, SMH) vào ngày 1 tháng 11 năm 2013. Hai tài sản này biến động cùng nhau vì hai lý do chính. Lý do thứ nhất là cơ học: khoảng 20% cổ phần ETF nắm giữ là cổ phiếu của INTC.

Thứ hai là về mặt kinh tế: ETF được thiết kế để đại diện cho ngành công nghiệp bán dẫn, do đó giá của nó sẽ biến động theo tin tức ảnh hưởng đến ngành đó, và tin tức đó cũng sẽ có tác động tương tự đến giá của INTC. Trong Chương 11, dành riêng cho giao dịch cặp và chênh lệch giá thống kê, chúng tôi dựa trên một số ý tưởng được trình bày ở đây để chỉ ra cách tận dụng thông tin do một tập hợp tài sản cung cấp. Cụ thể, chúng tôi trình bày các thuật toán giao dịch khác nhau dựa trên sự đồng tích hợp trong mức giá cổ phiếu hoặc trong thành phần trôi dạt của một tập hợp tài sản, dựa trên phân tích thực nghiệm sau. Phân tích của chúng tôi dựa trên mô hình lý thuyết sau: chúng tôi giả định rằng cả

INTC và SMH là những cổ phiếu có động lực bao gồm cả thành phần tạm thời (trở về giá trị trung bình) và thành phần cố định (Brown). Chúng tôi biểu diễn động lực của quá trình này dưới dạng vectơ như sau:

$$dS_t=\kappa\left(\theta-S_t\right)dt+\sigma dW_t,$$

trong đó $\Sigma=\sigma\sigma^{\prime}$ và $W_{t}$ là chuyển động Brown. Sự hiện diện của một thành phần quay trở lại giá trị trung bình (số hạng tỷ lệ thuận với $dt$)

mở ra cơ hội tạo ra lợi nhuận kỳ vọng dương từ giao dịch bằng cách khai thác khả năng dự đoán của thành phần đó. Trong trường hợp này, chúng tôi sử dụng thông tin kết hợp từ hai quy trình để tạo ra tín hiệu giao dịch mạnh hơn bằng cách xây dựng một tổ hợp tuyến tính của hai tài sản, được chi phối mạnh mẽ nhất bởi thành phần hồi quy trung bình (và là cơ sở cho một số thuật toán trong Chương 11). Điều này được thực hiện bằng cách biến đổi hệ thống trong Phương trình (3.4), có dạng tổng quát

ma trận $K$, thành một hệ thống tương đương,

$$d\tilde{S}_t=\tilde{\kappa}\left(\tilde{\theta}-\tilde{S}_t\right)dt+\tilde{\sigma}dW_t,$$

trong đó $K$ là ma trận đường chéo; nghĩa là, chúng ta tìm các hằng số ${\alpha_{11},\alpha_{12},\alpha_{21},\alpha_{22}}$ sao cho

$$\tilde{S}_{t,1}=\alpha_{11}S_{t,1}+\alpha_{1,2}S_{t,2}\\tilde{S}_{t,2}=\alpha_{21}S_{t,1}+\alpha_{2,2}S_{t,2}:,$$

Và

$$\bar{\kappa}=\left[\begin{array}{cc}\bar{\kappa}_1&0\0&\bar{\kappa}_2\end{array}\right].$$

Ma trận $K$ kết quả có $\left{\tilde{\kappa}{1},\tilde{\kappa}{2}\right}$ bằng với các giá trị riêng của $K$ và quá trình $S_{t,j}$ tương ứng với giá trị lớn nhất trong số này (theo giá trị tuyệt đối), $\max{|\tilde{\kappa}{1}|,|\tilde{\kappa}{2}|}$ sẽ có mức độ tiếp xúc mạnh nhất với quá trình hoàn nguyên trung bình và do đó sẽ chứa thông tin liên quan đến giao dịch nhất - tức là nó sẽ tạo ra tín hiệu giao dịch tốt nhất (xem các thuật toán được phát triển trong Chương 11). Chúng tôi minh họa điều này bằng một ước tính đơn giản về mối quan hệ giữa INTC

và SMH vào ngày 1 tháng 11 năm 2013. Chúng tôi lấy mẫu bằng giá trung bình và ước tính quy trình theo các khoảng thời gian đều đặn (mỗi 5 giây). Chúng tôi áp dụng phiên bản rời rạc của

	A	B
ΔS_L,INTC	0,011	0,997***
ΔS_L,SMH	0,035	0,002***

Bảng 3.11 Các tham số ước tính của VAR ( “ có ý nghĩa ở mức $1%$)

mô hình trong (3.4) và sử dụng nó để tính toán các giá trị của mô hình đã chuyển đổi trong (3.5) nhằm xây dựng tín hiệu giao dịch.

Để ước tính phiên bản rời rạc của mô hình (3.4), chúng tôi ước tính quá trình hồi quy tự động vectơ (VAR)

$$\Delta S_t=A+B:\Delta S_{t-1}+\varepsilon_t:,$$

trong đó $S_{t}:=:\left[S_{t,INTC}: S_{t,SMH}\right]^{\prime}$ là giá tài sản, và $\Delta S_{t,j}$ biểu thị sự thay đổi của tài sản $jA$ là một vectơ hằng số, $B$ là một ma trận hằng số và $Et$ là một vectơ nhiễu trắng. Các ước tính kết quả được mô tả trong Bảng 3.11. Từ những ước tính này, chúng ta có thể khôi phục các tham số của mô hình (3.4):

$$\kappa=\frac{\mathbf{I}-B}{\Delta t}=\left[\begin{array}{cc}0,003&-0,002\-0,003&0,002\end{array}\right]:,\quad\boldsymbol{\theta}=\kappa^{-1}\boldsymbol{A}:\Delta t=\left[\begin{array}{cc}24,30691\40,91387\end{array}\right]:,$$

và chéo hóa $K$ để thu được $\ddot{K}$ và $S$

$$\left.\kappa=U\cdot\Lambda\cdot U^{-1},\quad\tilde{\kappa}=\Lambda=\left[\begin{array}{cc}0.0047&0\0&0.0007\end{array}\right.\right]:,$$

$$\tilde{S}_t=U^{-1}S_t=\left[\begin{array}{cc}0,682&0,547\-0,731&0,837\end{array}\right]S_t.$$

Hình 3.6 INTC và SMH vào ngày 1 tháng 11 năm 2013: (trái) giá trung bình so với giá trung bình; (phải) hệ số đồng tích hợp. Trục $x$ là thời gian tính theo tỷ lệ phần trăm của ngày giao dịch. Đường nét đứt biểu thị mức giá trở về giá trị trung bình; đường nét đứt chấm biểu thị 2 dải độ lệch chuẩn.

Hằng số	$r_{t-1}$	$r_{t-2}$
$r_{LS,INTC}$	-0,000	-0,011
$r_{S,MH}$	0,000	-0,057
$r_{S,S}$	0,000	-0,195
$r_{S,1_2}$	-0,000	0,013

Bảng 3.12 Các tham số ước tính của AR(n) riêng lẻ, có ý nghĩa ở mức $1%$.

Trong Hình 3.6, chúng tôi hiển thị quy trình giá cho hai tài sản ở bảng bên trái và ở bảng bên phải là quy trình giá cho $S_{1}$, được gọi là hệ số đồng tích hợp. Kiểm tra trực quan (không bao gồm ở đây) cho thấy một sự đảo ngược trung bình mạnh hơn nhiều (thành phần tự hồi quy) đối với $S_{1}$ so với $S_{2}$. Chúng tôi xác minh điều này bằng cách chạy tự hồi quy trên lợi nhuận cho cả bốn quy trình giá: $TINTC$ ， $r_\mathrm{SMH}$ $r_{\bar{S}{1}}$ ， và $r{\bar{S}{2}}$ . Chúng ta có thể xem kết quả trong Bảng 3.12. Đối với các tài sản, INTC và SMIH, hệ số trên lợi nhuận trễ chỉ có ý nghĩa đối với ETF, SMH. Sau khi ước tính mô hình và áp dụng đường chéo trên $K$, lợi nhuận trên một trong các danh mục đầu tư kết quả, $S{1}$ (hệ số đồng tích hợp), có hệ số trên lợi nhuận trễ lớn hơn gần bốn lần so với hệ số trên SMH (và bao gồm một hệ số đáng kể bổ sung trên lợi nhuận hai kỳ trước đó).

Tài liệu tham khảo và bài đọc chọn lọc

Hasbrouck (1991), Ait-Sahalia, Mykland & Zhang (2005), Bandi & Russell (2008), Barndorff-Nielsen & Shephard (2004), Engle (2000), Hansen & Lunde (2006), Mykland & Zhang (2012), Cartea & Karyampas (2012), Corsi & Reno (2012), Bandi & Reno (2012), Barndorff-Nielsen & Shephard (2006), Barndorff-Nielsen & Shephard (2006b), Barndorf-Nielsen & Shephard (2004), Corsi (2009), Corsi, Pirino & Reno (2010), Ait-Sahalia và cộng sự. (2005), Cartea & Karyampas (2014), Hasbrouck (1995), Hasbrouck (1993) Bauwens & Hautsch (2006) Bauwens & Hautsch (2009), Cameron & Trivedi (2005), Ding, Hanna & Hendershott (2014).

Bằng chứng thực nghiệm và thống kê: Hoạt động và chất lượng thị trường

Chương này tiếp tục tổng quan về các vấn đề thực nghiệm bằng cách xem xét khối lượng và chất lượng thị trường. Như trong chương trước, chúng ta bắt đầu bằng cách xem xét khối lượng hàng ngày, đồng thời tập trung vào mối quan hệ của nó với độ biến động. Sau đó, chúng ta chuyển sang các mô hình "theo mùa" được quan sát thấy trong dữ liệu, cả về khối lượng lẫn giá. Phần 4.3 chuyển sang chất lượng thị trường. Đây là những biến số ảnh hưởng đến việc thực hiện giao dịch như chênh lệch giá, độ biến động, độ sâu và tác động của giá. Phần 4.4 xem xét hoạt động tin nhắn và mối quan hệ giữa việc hủy lệnh, thực hiện lệnh và khoảng cách từ giá trung bình. Chương kết thúc bằng việc xem xét các lệnh ẩn.

Khối lượng và độ biến động hàng ngày

Cho đến nay, chúng ta đã thấy rằng mức giá (và lợi nhuận của tài sản) trong suốt cả ngày rất khó dự đoán và biến động theo các lực lượng thị trường. Trong ngắn hạn, những mức giá này có đuôi dày, dễ thay đổi nhanh chóng (tốc độ thay đổi mức giá phụ thuộc vào tần suất giao dịch tài sản), những thay đổi này có xu hướng tập trung theo thời gian và rất có thể sẽ quay trở lại mức trước đó. Tuy nhiên, hoạt động giao dịch, thường được đo bằng khối lượng (hoặc số lượng)

(cổ phiếu hoặc giá trị cổ phiếu được giao dịch) có cấu trúc động khác biệt, có ảnh hưởng quan trọng đến cách chúng ta nhìn nhận dữ liệu thị trường. Andersen & Bondarenko (2014) đã nắm bắt ý tưởng này rất tốt:

Vì khối lượng và biến động có mối tương quan cao và thể hiện tính bền vững mạnh mẽ của chuỗi thời gian, bất kỳ biến số nào có tương quan với biến động chắc chắn sẽ sở hữu sức mạnh dự báo đáng kể cho biến động trong tương lai. Điều này đúng với chênh lệch giá mua-bán, cường độ báo giá, số lượng giao dịch, khối lượng giao dịch (chuẩn hóa)...

Phần này và các phần tiếp theo sẽ xem xét các khía cạnh thực nghiệm của một số biến liên quan đến tính biến động.

Bước đầu tiên, chúng tôi xem xét mối quan hệ giữa khối lượng giao dịch và độ biến động bằng cách sử dụng hồi quy mạnh cho bốn tài sản chính của chúng tôi (ISNS, FARO, MENT và AAPL) với khối lượng giao dịch hàng ngày là biến phụ thuộc. Như trong tiểu mục 3.1.4, chúng tôi ước tính hai mô hình bằng phương pháp OLS mạnh. Biến vế trái là logarit của số lượng cổ phiếu được giao dịch trong mỗi ngày giao dịch của năm 2013, $\log(1+Q_{t})$ (hãy nhớ rằng chúng tôi

phải thêm 1 vào $C_{t}$ vì đối với một số tài sản, đặc biệt là ISNS, có những ngày không có giao dịch và khối lượng bằng không)

Các biến bên phải là các biến chúng tôi đã sử dụng trong mô hình cho lợi nhuận trong ngày. Cụ thể, mô hình đầu tiên (M1) bao gồm một hằng số, các giá trị trễ của biến bên trái (khối lượng trễ), lợi nhuận trong ngày của VIX và SPY, lợi nhuận trong ngày đồng thời của tài sản, và OF là lưu lượng lệnh ròng trong ngày, trên NASDAQ, được định nghĩa là khối lượng mua trừ đi khối lượng bán.

Do đó, Mô hình 1 (M1) là

$$\log(1+Q_{t,j})=\alpha+\beta_{1,j}:\log(1+Q_{t-1,j})+\beta_{2,j}:\mathrm{SPY}_{t}+\beta_{3,j}:\mathrm{VIX}_{t}\+\beta_{4,j}:r_{t,j}+\beta_{5,j}:\mathrm{OF}_{t}+\epsilon_{j}:,$$

trong khi Mô hình 2 (M2) là

$$\begin{aligned}\log(1&+Q_{t,j})\&=\alpha+\beta_{1,j}\log(1+Q_{t-1,j})+\beta_{2,j}\operatorname{SPY}_{t}+\beta_{3,j}\operatorname{VIX}_{t}+\beta_{4,j}r_{t,j}+\beta_{5,j}\operatorname{OF} _{t}\&+\beta_{6,j}\left(\mathrm{SPY}_{t}\right)^{2}+\beta_{7,j}\left(\mathrm{VIX}_{t}\right)^{2}+\beta_{8,j}\mathrm{HL}_{t}+\beta_{9,j}\left(r_{t}\right)^{2}+\epsilon_{j}:.\end{aligned}$$

Ngoài các biến xuất hiện trong M1, M2 cũng bao gồm

· $(\mathrm{SPY}{t})^{2}.$ giá trị bình phương của lợi nhuận trong ngày trên ETF SPY, như một thước đo cho sự biến động trên toàn thị trường, · $(\mathrm{VIX}{t})^{2}$ giá trị bình phương của lợi nhuận' trong ngày trên VIX, như một thước đo cho sự biến động của biến động, hoặc sự thay đổi trong các thay đổi trong ngày về tâm lý thị trường, ●HL: (HL-volat): phạm vi giá của tài sản (tối đa $P_{t}-\operatorname{min}P_{t}$ ) trong ngày, như một thước đo cho sự biến động giá trong ngày và · $r_{t}^{2}:$ bình phương của lợi nhuận trong ngày của tài sản (một thước đo khác, riêng biệt, về sự biến động trong ngày)

Bảng 4.1 Hồi quy OLS mạnh mẽ của khối lượng trong ngày (In đậm: có ý nghĩa $5%$)

Kết quả trong Bảng 4.1 không cho thấy bằng chứng về tác động đáng kể từ các biến thị trường (VIX hoặc SPY) cũng như từ dòng lệnh lên khối lượng giao dịch. Chúng tôi cũng không tìm thấy tác động nào của lợi nhuận trong ngày. FARO có tác động tích cực và đáng kể trong M1, nhưng nó biến mất khi chúng tôi đưa vào các đại diện tốt hơn cho biến động trong ngày. Những gì chúng tôi tìm thấy là sự hỗ trợ đáng kể cho tuyên bố của Andersen và Bondarenko: khối lượng giao dịch dường như có tính bền vững đáng kể theo chuỗi thời gian, bằng chứng là hệ số chung, tích cực và có ý nghĩa đối với khối lượng của kỳ trước (M1 và M2 cho tất cả các tài sản) và tương quan tích cực và có ý nghĩa với biến động, được đo bằng biến động HL (trong M2, tất cả các tài sản). Biến động, được đo bằng bình phương của lợi nhuận trong ngày, dường như không có ý nghĩa thống kê khi có biến động HL.

Hoạt động trong ngày

Có những mô hình thực nghiệm nổi tiếng khác về khối lượng giao dịch trong ngày. Hình 4.1 cho thấy khối lượng (số lượng cổ phiếu được giao dịch trên NASDAQ) ở ba thang thời gian khác nhau trong suốt một ngày giao dịch của AAPL. Bảng trên cùng hiển thị kết quả trong cả ngày khi khối lượng được tổng hợp theo từng phút (mặc dù khối lượng trong vài phút đầu và cuối không nằm trong thang đo). Một đặc điểm nổi bật của ngày này là các đỉnh vào đầu và cuối ngày. Có một đỉnh thứ ba vào khoảng giữa trưa nhưng (như chúng ta thấy

sau đó) nó thể hiện một mô hình cụ thể cho ngày giao dịch này và không phải là đặc điểm chung được quan sát thấy khi giao dịch tài sản này.

Một đặc điểm nổi bật thứ hai là sự biến động lớn về khối lượng. Khi tính toán thống kê mô tả về khối lượng, chúng tôi tìm thấy giá trị trung bình là 6.898 cổ phiếu, độ lệch chuẩn là 7.014, và các phân vị Q1: 3.299, trung vị: 5.349 và Q3: 8.039. Mômen thứ ba và thứ tư cho chúng ta thước đo độ lệch là 6,14 và độ nhọn là 60,83. Tất cả những điều này khẳng định ấn tượng rằng khối lượng giao dịch trong ngày có các đỉnh giao dịch rất lớn.

Các đỉnh khối lượng có thể quan sát được tại một số phút nhất định, tạo thành một mô hình được lặp lại khi người ta phóng to vào các khoảng thời gian nhỏ hơn. Hai hình ảnh dưới cùng trong Hình 4.1 xem xét mô hình khối lượng trong cửa sổ 30 phút và một phút vào giữa ngày. Bảng bên trái so sánh khối lượng được tổng hợp trong các khoảng thời gian mười giây với mức trung bình một phút của chúng (đường đậm). Chúng ta thấy sự thay đổi đáng kể với các đỉnh giao dịch lớn xen kẽ với các khoảng thời gian tương đối yên tĩnh. Phóng to hơn nữa, mô hình trong bảng bên phải thậm chí còn nổi bật hơn. Đối với một phút duy nhất trong ngày, các cột màu xám xác định khối lượng được tổng hợp trong một giây, trong khi các chấm lớn biểu thị khối lượng được tổng hợp ở 20 ms (gần tương đương với việc vẽ biểu đồ các giao dịch riêng lẻ). Các giao dịch dường như được phân bổ ngẫu nhiên trong một phút và không rõ liệu sự tập trung các thay đổi về giá mà chúng ta đã thấy trước đó (trong tiểu mục 3.3) cũng diễn ra ở thang thời gian này hay không. Các giao dịch dường như cũng xảy ra theo bội số của 100 cổ phiếu. Thực tế là các giao dịch xảy ra ở số lượng tròn là một đặc điểm của tổ chức.

Các nhà thiết kế và quản lý thị trường phân biệt giữa lô lẻ, lô chẵn, lô hỗn hợp và lô tròn. Lô tròn là một thông điệp hoặc giao dịch liên quan đến các đơn vị lô chẵn (lô chẵn là 100 cổ phiếu). Lô lẻ là các giao dịch nhỏ hơn lô chẵn và có thể tốn kém hơn khi giao dịch (về phí/hoa hồng), trong khi lô hỗn hợp là các giao dịch bao gồm cả lô tròn và lô lẻ. Lô lẻ đôi khi được tổng hợp và không được hiển thị trên bảng tin hợp nhất (mã chứng khoán công khai bao gồm tất cả các giao dịch từ tất cả các sàn giao dịch). Ngoài ra, giao dịch lô lẻ phải tuân theo các quy tắc đặc biệt đang trong quá trình thay đổi và xem xét lại (xem ví dụ: Thông cáo số 34-71057 của SEC (2013b), về việc báo cáo lô lẻ và những thay đổi trong định nghĩa về lệnh "thị trường")

Có nhiều thuật toán dựa trên hoặc liên kết với khối lượng. Ví dụ, một số thuật toán thực hiện (xem Chương 6, 7 và 8) có thể yêu cầu các MO được gửi đến sàn giao dịch không vượt quá một tỷ lệ phần trăm nào đó so với những gì những người tham gia thị trường khác đang giao dịch tại thời điểm đó. Tương tự như vậy, một số thuật toán được thiết kế để giao dịch theo một hướng nhất định, mua hoặc bán tài sản, đồng thời nhắm mục tiêu vào một tỷ lệ phần trăm nhất định của thị trường - những thuật toán này được gọi là POV hoặc thuật toán phần trăm khối lượng. Hơn nữa, khối lượng đóng một vai trò rất quan trọng trong việc xác định các chuẩn mực chi phí thực hiện. Một trong những chuẩn mực quan trọng nhất trong số này là VWAP, viết tắt của giá trung bình có trọng số theo khối lượng. Chúng tôi dành Chương 9 cho các thuật toán nhắm mục tiêu POV và VWAP, trong đó chúng tôi cũng mở rộng thảo luận về khối lượng trong ngày mà chúng tôi sẽ chuyển sang.

Hình 4.2 Thể tích theo thời gian trong ngày.

Mẫu khối lượng trong ngày

Để hiểu rõ hơn về các mô hình khối lượng giao dịch trong ngày, trong Hình 4.2, chúng tôi hiển thị bản đồ nhiệt (bảng bên trái) về khối lượng giao dịch hàng ngày trong năm 2013 của AAPL và MENT. Bản đồ nhiệt được tạo bằng cách đầu tiên phân nhóm khối lượng giao dịch thành các khung thời gian năm phút trong suốt cả ngày, cho tất cả các ngày trong năm. Sau đó, đối với mỗi khung thời gian năm phút, chúng tôi tính toán phân phối khối lượng. Bản đồ nhiệt là hình ảnh trực quan hóa tập hợp các phân phối này cho mỗi khung thời gian năm phút cùng một lúc. Trong các hình, chúng tôi sử dụng các đường màu để biểu diễn tứ phân vị thứ nhất và thứ ba, cũng như trung vị. Chúng tôi thấy rằng khối lượng giao dịch của AAPL rất lớn vào đầu ngày, và

Giao dịch chậm dần cho đến khoảng 14:00, lúc này có một đợt tăng nhẹ. Đợt tăng lúc 14:00 dần dần tích tụ và tăng tốc trong nửa giờ cuối cùng của phiên giao dịch, đạt đỉnh vào lúc đóng cửa.

Một giả thuyết hợp lý cho đợt tăng giá lúc 14:00 là vào thời điểm đó, có nhiều thông báo hơn bình thường, và những thông báo này có xu hướng tạo ra khối lượng giao dịch lớn hơn. Ví dụ, Ngân sách Kho bạc hàng tháng được công bố vào thời điểm đó trong ngày. Trước đó, chúng ta đã thấy con số này vào ngày 30 tháng 7. Ở đó, chúng ta đã thấy các đỉnh điểm thường thấy vào đầu và cuối ngày, cũng như một đỉnh điểm về khối lượng giao dịch vào khoảng giữa trưa, điều mà giờ đây chúng ta có thể thấy là bất thường đối với thời điểm này.

Để giải thích các đỉnh vào đầu và cuối ngày, chúng ta cần đưa ra giả thuyết về các yếu tố thúc đẩy khối lượng. Một giả thuyết phổ biến trong tài liệu, cũng được đưa ra ở đây, là thông tin mới tạo ra khối lượng lớn hơn. Ngoài đợt tăng đột biến lúc 14:00, điều này cũng giải thích tại sao lại có khối lượng lớn như vậy vào và ngay sau khi mở cửa, vì tin tức qua đêm dần dần được đưa vào giá trong thời gian đó. Tuy nhiên, giả thuyết này không giải thích được mức độ tăng khối lượng vào cuối ngày, vì không có nhiều thông báo bất thường vào thời điểm đó. Tuy nhiên, trong Chương 7, chúng ta sẽ thấy một lời giải thích khả dĩ khác cho đỉnh giao dịch này vào cuối ngày: các nhà giao dịch chưa thể đạt được mục tiêu thanh lý của mình sẽ đẩy nhanh việc thực hiện giao dịch khi thị trường đến gần thời điểm đóng cửa. Một lời giải thích thứ hai, không liên quan, có thể là các nhà giao dịch có thể thích hoãn các lệnh không khẩn cấp vào cuối ngày khi chi phí thực hiện thấp hơn (Xem ví dụ Mục 4.3.5, trong đó chúng tôi thảo luận về tác động của giá, đặc biệt là Hình 4.11, trong đó chúng tôi chỉ ra rằng tác động của các lệnh (đi bộ LOB) thấp hơn vào cuối ngày giao dịch đối với INTC và trong Chương 6, chúng tôi chỉ ra hành vi tương tự đối với SMH, xem Hình 6.1). Cuối cùng, các chiến lược nhắm mục tiêu vào khối lượng (chẳng hạn như các chiến lược được phát triển trong Chương 9) sẽ tự nhiên làm trầm trọng thêm sự gia tăng khối lượng dự kiến trong giai đoạn này.

Các bảng bên phải của Hình 4.2 mở rộng phân tích của chúng tôi hơn nữa. Chúng thể hiện phương pháp phân tích dữ liệu chức năng (FDA) để xem dữ liệu. Trong các biểu đồ này, đối với mỗi ngày giao dịch, chúng tôi hồi quy khối lượng năm phút đã thực hiện theo đa thức Legendre và vẽ đường cong kết quả dưới dạng một đường mảnh trong hình. Điều này tạo ra một đường cong khối lượng trơn tru cho mỗi ngày trong năm. Sau đó, chúng tôi vẽ giá trị trung bình của các đường cong này (đường liền màu xanh lam) biểu thị khối lượng giao dịch dự kiến (hoặc trung bình) trong suốt cả ngày cho mã chứng khoán tương ứng. Những kết luận mà chúng tôi rút ra về hành vi của khối lượng nhưng chúng tôi có thêm những hiểu biết sâu sắc

Trong các bảng bên phải, chúng ta quan sát thấy bốn giá trị ngoại lệ lớn đối với bốn đường cong AAPL biến mất khỏi đáy thang đo. Chúng đại diện cho bốn ngày đặc biệt trong năm 2013. Ba trong số bốn ngày này có thể dự đoán được trong khi ngày còn lại thì không. Ba ngày có thể dự đoán được tương ứng với ngày 3 tháng 7 (Ngày Độc lập), ngày 29 tháng 11 (Lễ Tạ ơn) và ngày 24 tháng 12 (Giáng sinh) khi NASDAQ đóng cửa sớm (13:00) cho kỳ nghỉ lễ. Những ngày này bị loại khỏi các phép tính cho MENT. Giá trị ngoại lệ thứ tư tương ứng với ngày 22 tháng 8 năm 2013. Vào ngày này, NASDAQ đã gặp phải các vấn đề lớn dẫn đến việc thị trường đóng cửa trong khoảng ba giờ. Vì vậy, ngoài việc xác định các quy luật trong các mô hình giao dịch trong ngày, các đường cong FDA đã giúp chúng tôi xác định các giá trị ngoại lệ trong dữ liệu. Các giá trị ngoại lệ rất quan trọng khi sử dụng dữ liệu lịch sử để phân tích, kiểm tra ngược và thiết kế thuật toán. Thông thường, một giá trị ngoại lệ sẽ có tác động không cân xứng đến lợi nhuận của thuật toán, cho dù khi kiểm tra ngược theo các sự kiện lịch sử hay chạy trực tiếp trên thị trường. Do đó, việc theo dõi các giá trị ngoại lệ này và tính đến chúng trong quá trình thiết kế và đánh giá thuật toán là rất quan trọng. Trong phân tích lịch sử của chúng tôi về mô hình khối lượng giao dịch trong ngày, hàm khối lượng giao dịch trung bình hàng ngày của AAPL được vẽ trong bảng bên phải thấp hơn

Hình 4.3 Mô hình giao dịch trong vòng một giây.

hơn là nó sẽ như thế nào nếu chúng ta không bao gồm bốn ngày cụ thể đó trong ước tính

Để so sánh hành vi trong ngày của AAPL với hành vi trong ngày của một tài sản ít được giao dịch hơn, Hình 4.2 hiển thị cùng một phân tích cho MENT. Chúng tôi quan sát thấy các đỉnh hàng ngày vào đầu và cuối ngày cũng ở đó mặc dù có một chút thay đổi và bị bóp méo bởi tính rời rạc của các lô giao dịch. Đối với MENT, đợt bùng nổ giao dịch ban đầu không thường xuyên như với AAPL. Như chúng ta có thể thấy từ các hình ảnh bên phải, có một số lượng đáng kể các ngày mà giao dịch bắt đầu chậm bất thường. Những ngày chậm này cân bằng với các đợt bùng nổ giao dịch từ những ngày khác, do đó, khối lượng trung bình trong giao dịch đầu ngày dường như không khác biệt đáng kể so với khối lượng trong phần còn lại của ngày. Vào cuối ngày, chúng ta thấy một lượng lớn hoạt động giao dịch trong MENT. Chúng tôi đã loại bỏ ISNS và FARO khỏi phân tích này, vì tần suất

Giao dịch các tài sản đó thậm chí còn thấp hơn so với MENT, và do đó có nhiều quan sát khối lượng bằng không hơn. Các số liệu thu được tương tự về mặt định tính, mặc dù có nhiều nhiễu hơn trong ước tính và số lượng khoảng thời gian giao dịch bằng không lớn hơn nhiều.

Mẫu khối lượng trong giây

Khi làm việc với các khoảng thời gian nhỏ hơn nhiều so với một giây, một câu hỏi tự nhiên được đặt ra là liệu chúng ta có quan sát thấy các mô hình thời gian ở những khoảng thời gian nhỏ như vậy hay không, giống như những mô hình chúng ta đã tìm thấy trong suốt cả ngày. Chỉ tập trung vào AAPL, chúng ta xem xét mô hình giao dịch mili giây, tức là, đối với mỗi giao dịch, chúng ta xem xét mili giây mà giao dịch đó diễn ra. Trong Hình 4.3, chúng tôi hiển thị số lượng giao dịch trung bình tại mỗi mili giây cho mỗi ngày trong năm 2013 (AAPL), cũng như các tứ phân vị (Q1, trung vị và Q3) cho giá trị trung bình hàng ngày cho mỗi mili giây (các tứ phân vị đã được làm mịn bằng cách sử dụng đường trung bình động). Chúng ta thấy rằng hầu như không có một mô hình cố định nào ở cấp độ mili giây, al-

mặc dù có thể quan sát thấy sự tăng đột biến ban đầu ở phạm vi 000-020 ms, tiếp theo là một sự tăng đột biến tinh tế

Hình 4.4 Hàm phân phối tích lũy của số lượng giao dịch theo mili giây cụ thể.

Thung lũng kết thúc quanh điểm 100 ms. Để tìm hiểu chi tiết hơn về điều này, trong Hình 4.4, chúng tôi xác định hàm phân phối tích lũy theo kinh nghiệm của số lượng giao dịch kết thúc ở sáu mili giây khác nhau: ba giao dịch sớm (ở 4, 5 và 6 mili giây), và ba giao dịch muộn hơn (ở 104, 105 và 106 ms). Từ hình, chúng ta có thể thấy rằng các mili giây sớm chiếm ưu thế ngẫu nhiên so với ba giao dịch còn lại. (Việc lựa chọn 104-106 là tùy ý và mô hình tương tự cũng được quan sát thấy nếu chúng ta chọn các mili giây khác để so sánh với những gì xảy ra ở 4, 5 và 6, đôi khi thậm chí còn rõ ràng hơn.)

Mẫu hình này cho thấy có một số lượng bất thường các giao dịch được ghi lại ngay sau thời điểm bắt đầu chính xác của một giây. Một lời giải thích hợp lý là có thể có một số lượng bất thường các giao dịch được nhập (tự động) vào đúng thời điểm kết thúc/bắt đầu của một giây, và điều chúng ta quan sát được là độ trễ hoặc sự không đồng bộ về mặt đồng hồ của các lệnh (máy móc) này.

4.2.3 Mô hình giá

Việc xem xét các mô hình khối lượng là khá phổ biến, nhưng không phải mô hình giá thì không. Trong phần này, chúng tôi đặt câu hỏi liệu các lệnh khớp lệnh ở mức giá kết thúc bằng bội số 5 cent (giá trị tròn) có khác với các lệnh khớp lệnh không kết thúc bằng bội số 5 cent (giá trị tròn) hay không. Không có lý do cơ bản nào đủ mạnh để giải thích tại sao giá của một tài sản, về mặt lý thuyết chỉ chiếm một phần thu nhập của cổ đông do một công ty tạo ra, lại có giá trị tròn, chẳng hạn như 450,25 đô la hoặc 21,00 đô la. Tuy nhiên, nếu xem xét tần suất quan sát các giao dịch diễn ra ở các mức giá khác nhau được nhóm theo số cent trong giá, chúng ta sẽ thấy mô hình được hiển thị trong Hình 4.5.2. Hình này cũng thể hiện các tứ phân vị Q1, trung vị và Q3 dưới dạng đường liền. Các mô hình này khá rõ ràng. Có một sự tích lũy rất lớn các giao dịch.

các giao dịch có giá kết thúc bằng giá đô la chính xác, một số lượng lớn các giao dịch có giá kết thúc bằng 50 xu và các đợt tăng đột biến về số lượng giao dịch lớn hơn bình thường ở mức giá kết thúc bằng đơn vị 10 xu và thậm chí là 5 xu (phần lớn những khác biệt này có ý nghĩa thống kê)

2 Để cải thiện hình ảnh, 10 thành tựu cao nhất trong năm đã bị xóa khỏi hình ảnh và ước tính tứ phân vị (10 trên 98.280))

Hình 4.5 Mẫu giá: tần suất thực hiện theo số xu trong giá.

Có một cách giải thích khá đơn giản cho hiện tượng này, đó là vì một lý do nào đó (hợp lý hay không), người ta ưa chuộng việc cung cấp thanh khoản ở mức giá kết thúc bằng giá trị tròn cent. Chúng tôi sử dụng thuật ngữ "ưa thích cung cấp thanh khoản", vì giá giao dịch (phần lớn) được xác định bởi một MO tích cực lấp đầy một LO cố định, do đó, các nhà cung cấp thanh khoản là những người quyết định chấp nhận số lượng lệnh thực hiện lớn hơn ở một mức giá cụ thể.

Tại sao các tác nhân lại cung cấp thanh khoản theo cách này? Chúng ta có thể giả định rằng có một số lệnh dừng lỗ và lệnh động lượng được lập trình để thực hiện như MO ở mức giá tròn. Những lệnh này có thể là lệnh tiềm ẩn, được lập trình bởi các tác nhân quyết định vào/ra khi giá vượt qua một rào cản nhất định, được thiết lập về mặt tâm lý hoặc thuận tiện ở một số nguyên. Kiểu lập luận này phù hợp với các ý tưởng của nhà biểu đồ như ^giá hỗ trợ' và *giá trần'. Nếu lập luận trên là đúng, thì việc tích lũy các lệnh thực hiện ở những mức giá đó có thể được kích hoạt bởi nhu cầu thanh khoản dựa trên tâm lý, sau đó được cung cấp một cách vui vẻ bởi các tác nhân không có khuynh hướng tâm lý như vậy và kỳ vọng rằng nhu cầu thanh khoản bất thường ở những mức giá này là không hợp lý bởi các yếu tố cơ bản về vi mô kinh tế/thị trường (và do đó, là một nguồn lợi nhuận).

Giao dịch và Chất lượng Thị trường

Thị trường tài chính đóng vai trò then chốt trong việc hỗ trợ nền kinh tế thị trường phân bổ nguồn lực theo thời gian và bất ổn. Thị trường tài chính cung cấp diễn đàn cho các công ty huy động vốn và tạo điều kiện cho nhà đầu tư tham gia vào tiến trình phát triển kinh tế chung của nền kinh tế. Trong bối cảnh này, thị trường chứng khoán là nơi người nắm giữ cổ phiếu có thể chuyển đổi cổ phiếu thành tiền mặt (và ngược lại) một cách nhanh chóng và với mức giá hợp lý. Trong phần này, chúng ta sẽ xem xét các cách khác nhau để đo lường hiệu quả của thị trường trong vai trò này, được gọi chung là *chất lượng thị trường. Trong tiểu mục 4.2.1, chúng tôi đã sử dụng hai lập luận cơ bản để giải thích các mô hình trong ngày:

rằng thông tin mới làm tăng khối lượng giao dịch và mong muốn giao dịch tăng lên (ví dụ do tính cấp bách của nhà giao dịch tăng lên) tương tác với chất lượng của thị trường

ket, yếu tố phản hồi để thúc đẩy giao dịch tiếp theo. Chất lượng thị trường đi thẳng vào lập luận thứ hai: sự gia tăng khối lượng kỳ vọng tạo ra kỳ vọng về chất lượng thị trường tốt hơn, tức là hiệu quả của thị trường trong việc tạo điều kiện giao dịch được cải thiện thông qua chi phí thực hiện lệnh (chênh lệch giá) thấp hơn, hiệu quả giá cao hơn (ít bị đảo ngược về mức giá trung bình hoặc biến động tạm thời thấp hơn), v.v., từ đó dẫn đến khối lượng giao dịch lớn hơn. Trong lập luận thứ nhất, chất lượng thị trường đi vào lập luận gián tiếp, vì nó điều chỉnh mối quan hệ giữa các tác động ngoại sinh của thông tin mới và mong muốn thực hiện giao dịch của nhà giao dịch. Dù thế nào đi nữa, nếu chất lượng thị trường thay đổi, hoạt động giao dịch cũng sẽ thay đổi theo.

Vậy điều gì quyết định chất lượng thị trường? Điều gì quyết định hiệu quả của thị trường trong việc tạo thuận lợi cho giao dịch? Đương nhiên, chi phí trực tiếp của giao dịch rất quan trọng: người ta phải trả bao nhiêu cho cổ phiếu mà mình muốn mua; giá mà người ta trả so với giá trị thị trường của nó là bao nhiêu; người ta coi trọng thông tin thu được từ thị trường như thế nào và việc hoàn tất giao dịch có dễ dàng không? Hãy nghĩ đến một khu chợ gia súc thời trung cổ. Giả sử một người sống trong một trang trại cách đều hai thị trấn cùng họp chợ gia súc hàng tuần vào cùng một ngày trong tháng. Làm thế nào để lựa chọn giữa hai thị trấn này? Người ta có thể sẽ đến khu chợ có nhiều khả năng đưa ra mức giá tốt nhất, có thể đạt được mức giá này sau một quá trình mua bán dễ dàng, với sự đảm bảo chắc chắn nhất rằng giao dịch được hoàn tất và người ta có thể ra về với số tiền đã bỏ ra. Trong một thị trường tài chính, nơi các tác nhân mua và bán, những khía cạnh sau đây để đánh giá chất lượng của một thị trường là: có đủ thông tin để xác định giá trị thị trường thực sự của tài sản, có thể mua (hoặc bán) bất kỳ số lượng nào với mức giá đủ gần với giá trị của tài sản, và có sự tin tưởng rằng các giao dịch được thực hiện. Tất nhiên, người ta có thể có những nghi ngại về sự tồn tại của một thứ gọi là 'giá thị trường thực' của một tài sản, nhưng bất kể thế nào, đây là một khái niệm hữu ích để làm việc và là cơ sở của nhiều tài liệu. Nếu một người không tin rằng có hoặc có thể có một thứ như giá thị trường thực, thì khái niệm này vẫn hữu ích như một cấu trúc lý thuyết trong nghiên cứu về cấu trúc vi mô của thị trường, giống như khái niệm về khí lý tưởng hữu ích trong vật lý. Trong danh sách ngắn các chiều của chất lượng thị trường, chiều cuối cùng (tôn vinh

Giao dịch) thường được coi là điều hiển nhiên, mặc dù khi giá cả biến động lớn, chúng ta thấy một số giao dịch bị sàn giao dịch hủy (thường là do chúng xảy ra ở mức giá *vô lý'). Hai vấn đề còn lại được nắm bắt bằng các biện pháp đánh giá chất lượng thị trường như chênh lệch giá, tác động giá, biến động, khả năng phục hồi, độ sâu, xác suất giao dịch có thông tin (được gọi là PIN), v.v. Chênh lệch giá đo lường chi phí tức thời khi thực hiện một giao dịch tích cực; tác động giá đo lường chi phí thực hiện các giao dịch lớn hơn thông qua tác động của giao dịch lên giá; biến động đo lường hiệu quả của giá trong việc truyền tải thông tin về giá trị thị trường của một tài sản; khả năng phục hồi liên quan đến tác động thị trường và đo lường khả năng của thị trường trở lại trạng thái cân bằng sau một giao dịch; độ sâu đo lường lượng thanh khoản có thể nhìn thấy trên thị trường và PIN đo lường mức độ bất đối xứng thông tin trên thị trường và do đó, giống như biến động, khả năng của thị trường

để truyền tải thông tin về giá trị thị trường của một tài sản. Bây giờ chúng ta sẽ xem xét chênh lệch giá, độ biến động, độ sâu và tác động giá.

4.3.1 Chênh lệch

Chênh lệch giá đo lường chi phí thực hiện của các giao dịch nhỏ bằng cách đo lường mức độ gần gũi giữa giá của giao dịch với giá thị trường. Vấn đề đầu tiên, tất nhiên, là xác định "giá thị trường thực tế". Cách tiếp cận đơn giản và phổ biến nhất là sử dụng giá trung bình.

$$S_t=\frac{1}{2}(a_t+b_t):,$$

Giá trung bình đơn giản của giá chào mua tại $b_{t}$ $(b_{t})$ và giá chào bán tại $u_{t}$ $(a_t)$. Tham chiếu này dựa trên khái niệm kinh tế rằng giá thị trường là giá cân bằng, mức giá mà tại đó cầu bằng cung, và trong một thị trường có ma sát tạo ra khoảng cách giữa giá mua tốt nhất (giá chào bán) và giá bán tốt nhất (giá chào mua), trạng thái cân bằng nên nằm ở đâu đó ở giữa. Giá trung bình là cách đơn giản nhất để ước tính giá thị trường này, mặc dù, như đã thấy trong Chương 2, chênh lệch giá có thể phát sinh vì nhiều lý do khác nhau (bù trừ rủi ro tồn kho, hoặc lựa chọn bất lợi từ việc giao dịch với các nhà giao dịch có hiểu biết hơn) và trong một số trường hợp, "giá thực" có thể gần với giá chào mua hoặc giá chào bán hơn. Chúng ta cũng đã thấy một ước tính khác về giá thị trường trước đó, đó là giá vi mô.

Giá được định nghĩa trong (3.3). Điều này có vẻ có ý nghĩa hơn về mặt kinh tế (và để phát triển các chiến lược giao dịch thuật toán) vì nó kết hợp số lượng chào bán và mua tại giá mua và giá bán (tương ứng) để cân nhắc giá mua và giá bán, và điều này có thể phản ánh tốt hơn một số vấn đề về cấu trúc vi mô được mô tả ở trên. Có những mô hình khác, tinh vi hơn, cố gắng ước tính giá cân bằng, ví dụ bằng cách tách các biến động trong giá trung bình thành một thành phần tạm thời và một thành phần cố định (thành phần cố định là giá cân bằng), nhưng chúng tôi sẽ không đề cập đến chúng ở đây. Hai thước đo chênh lệch giá phổ biến nhất là chênh lệch giá niêm yết và chênh lệch giá hiệu dụng.

Chênh lệch giá, cả hai đều sử dụng giá trung bình làm giá thị trường. Chênh lệch giá niêm yết, QS, là chênh lệch giữa giá chào bán và giá chào mua.

$$\mathrm{QS}_t=a_t-b_t,$$

và thể hiện chi phí tiềm ẩn của tính tức thời: chênh lệch giá giữa việc niêm yết lệnh bán ở mức giá tốt nhất và việc thực hiện tích cực lệnh bán (MO) (và do đó 'vượt qua chênh lệch giá') tại bất kỳ thời điểm nào. Nó cũng phản ánh khoảng cách so với giá thị trường, nếu lấy giá trung bình làm tham chiếu. Chi phí giao dịch trực tiếp của lệnh bán thị trường sẽ là $S_{t}-b_{t}=\mathrm{QS}{t}/2$, trong khi chi phí giao dịch trực tiếp của lệnh mua thị trường sẽ là $a{t}-S_{t}=\mathrm{QS}_{t}/2$ (nửa chênh lệch giá được niêm yết). Ngược lại, chênh lệch giá hiệu dụng (nửa) ES đo lường chênh lệch thực tế

giữa giá đã trả và giá trung bình, đối với lệnh mua thị trường là

$$\mathrm{ES}_t=a_t-S_t:,$$

trong khi đối với lệnh bán thị trường thì là

$$\mathrm{ES}_t=S_t-b_t:.$$

Đối với một MO được thực hiện đầy đủ trên sàn giao dịch so với một LO hiển thị, chênh lệch giá hiệu dụng bằng nửa chênh lệch giá niêm yết (nếu nó không đi qua LOB). Đôi khi, chênh lệch giá hiệu dụng sẽ lớn hơn nếu nó đi qua LOB, hoặc nhỏ hơn nếu nó được khớp với một lệnh ẩn bên trong chênh lệch giá, thậm chí có thể âm nếu lệnh ẩn được niêm yết một cách mạnh mẽ. (Chúng ta đã thấy các lệnh ẩn trong bối cảnh các loại lệnh khác nhau trong tiểu mục 1.3.4 và chúng ta sẽ thảo luận thêm về điều này trong tiểu mục 4.5. Một lệnh ẩn là một LO được niêm yết trong LOB nhưng không hiển thị cho những người tham gia thị trường.) Chênh lệch giá hiệu dụng âm phản ánh rằng người ta đang mua ở mức giá thấp hơn hoặc bán ở mức giá cao hơn *giá thị trường' (được biểu thị bằng giá trung bình). Trong phân tích thực nghiệm, các chênh lệch giá này thường được chuẩn hóa và thể hiện bằng điểm cơ bản so với giá trung bình. Trong Bảng 4.2, chúng ta xem xét chênh lệch giá niêm yết của bốn tài sản trong năm 2013.

(sắp xếp theo thứ tự từ ít giao dịch nhất đến nhiều nhất). Đối với mỗi tài sản, chúng tôi tính toán chênh lệch giá niêm yết trung bình theo thời gian, tQS, cho mỗi phút trong ngày. Giá trị này được tính như sau: cho mỗi phút trong ngày, $t=1:390$, trong khi thị trường mở cửa (từ 9:30-16:00),

$$\mathrm{tQS}_t=\sum_{i=1}^{n-1}(\tau_{i+1}-\tau_i):\mathrm{QS}_{t_i}:,$$

trong đó $i\in{1,\ldots,n}$ lập chỉ mục thời gian (tính bằng phút) mà chênh lệch giá được báo giá thay đổi trong phút $t$ ， $7ji$ . Bảng 4.2 mô tả số liệu thống kê theo phút của mỗi ngày trong năm 2013 (252 ngày giao dịch) cho từng tài sản.

Tài sản	Trung bình	Độ lệch chuẩn	P01	Q1	Trung vị	Q3	P99
ISNS	33,2	270,8	2,0	11,0	22,0	40,0	129,2
FARO	23,9	192.0	2.4	8,9	12.0	16.6	71,0
MENT	3.5	27.4	1.0	1.0	1.1	2.0	13.9
AAPL	13,6	54,7	5,4	11,0	13,8	16,9	29,3

Bảng 4.2 Chênh lệch giá niêm yết trung bình theo thời gian (tính bằng xu)

Thống kê mô tả của mẫu kết quả được trình bày trong Bảng 4.2. Điều đầu tiên cần lưu ý là dữ liệu trong bảng cho thấy các tài sản được giao dịch thường xuyên hơn có mức chênh lệch thấp hơn. Mối quan hệ tích cực giữa khối lượng và chất lượng thị trường có thể diễn ra theo cả hai hướng: khối lượng thu hút thanh khoản và cải thiện chất lượng thị trường, hoặc chất lượng thị trường cao hơn tạo điều kiện thuận lợi cho giao dịch và tạo ra khối lượng lớn hơn.

Tuy nhiên, AAPL dường như có mức chênh lệch giá rất lớn. Tuy nhiên, nhớ lại cuộc thảo luận về kích thước tick trước đó, mức chênh lệch giá lớn của AAPL chỉ là ảo tưởng vì chúng tôi chưa điều chỉnh theo kích thước tick tương đối. Giá trung bình (cuối

(mỗi phút) cho các tài sản của chúng tôi là: ISNS $5,25, FARO $40,62, MENT $19,93 và AAPL $473,00. Điều này ngụ ý rằng chênh lệch giá trung vị được niêm yết là: đối với ISNS 419 điểm cơ bản, FARO 29,5 điểm cơ bản, MENT 5,5 điểm cơ bản và AAPL 2,9 điểm cơ bản. Bằng cách đánh giá chênh lệch giá so với giá trung bình, chúng tôi khôi phục lại mối quan hệ dự kiến giữa chênh lệch giá niêm yết và khối lượng giao dịch.

Cũng từ Bảng 4.2, chúng ta có thể tính toán khoảng liên tứ phân vị (tính theo phần trăm của trung vị). Từ những phép tính này, chúng ta thấy rằng các tài sản được giao dịch thường xuyên hơn có xu hướng có mức chênh lệch giá niêm yết ít biến động hơn (các con số là: 1,32 điểm cơ bản cho ISNS, 0,64 điểm cơ bản cho FARO, 0,91 điểm cơ bản cho MENT và 0,42 điểm cơ bản cho AAPL).

Ví dụ về MENT minh họa một khía cạnh khác về tầm quan trọng của kích thước tick, điều này rất được quan tâm, đặc biệt là đối với các cơ quan quản lý. Tại Hoa Kỳ (đối với các tài sản có giá lớn hơn một đô la), kích thước tick tối thiểu được pháp luật cố định ở mức một xu — có nhiều cách để giao dịch theo phần nhỏ của một xu nhưng mức tối thiểu một xu mang tính ràng buộc trong hầu hết các trường hợp. Việc áp đặt kích thước tick tối thiểu là một xu có thể ảnh hưởng đến giao dịch đối với một số tài sản, chẳng hạn như MENT. Từ Bảng 4.2, chúng ta có thể thấy rằng đối với gần 50 phần trăm tổng số phút, mức tối thiểu một xu đang hạn chế chênh lệch giá niêm yết của MENT ở mức đó (một xu). Điều này chuyển thành chênh lệch giá niêm yết tối thiểu tương đối có thể lớn đáng kể (khoảng 5 điểm cơ bản đối với MENT) và có thể hạn chế chất lượng thị trường đối với tài sản này.

Nhận xét cuối cùng về Bảng 4.2: các số liệu trong bảng này bị ảnh hưởng bởi một sự kiện mà chúng tôi đã đề cập trước đó, trong tiểu mục 4.2.1, cụ thể là dữ liệu không được hiệu chỉnh cho các lần dừng giao dịch, và đặc biệt là cho lần dừng giao dịch vào ngày 22 tháng 8. Chúng tôi không đưa bảng đã hiệu chỉnh vào vì chúng không khác biệt đáng kể và do đó không cần thiết, nhưng chỉ vì tập dữ liệu của chúng tôi bao gồm tất cả các phút trong năm 2013, gần 100.000 quan sát trên mỗi tài sản, do đó tác động tổng thể lên các tổng hợp thống kê là rất nhỏ. Tuy nhiên, chúng tôi muốn nhân cơ hội này để chỉ ra tầm quan trọng của việc nắm rõ chi tiết tập dữ liệu của bạn. Trong tập dữ liệu ITCH, tất cả các thông báo đều được ghi lại và đóng dấu thời gian, ngay cả khi thị trường bị dừng và không có giao dịch. Chúng tôi đã đề cập trước đó về việc NASDAQ đã dừng giao dịch trong ba giờ vào ngày 22 tháng 8. Trong thời gian đó, các thông báo liên tục được gửi đến sàn giao dịch và được đóng dấu thời gian. Cụ thể, nhiều lệnh đã bị hủy và giá chào bán ('ask') và giá chào mua ('bid') đã biến động đáng kể. Khi giao dịch bị tạm dừng, những biến động này dẫn đến chênh lệch giá nhân tạo lớn và tiêu cực, đồng thời làm ô nhiễm dữ liệu trong Bảng 4.2 (chủ yếu là giá trị trung bình và độ lệch chuẩn, mặc dù ảnh hưởng là nhỏ). Nếu chúng tôi muốn sử dụng phân tích của mình để giao dịch hoặc thiết kế một thuật toán, đặc biệt nếu nó liên quan đến học sâu/không giám sát, dữ liệu chưa được lọc có thể tạo ra những biến dạng đáng kể. Chúng tôi cũng đã tính toán chênh lệch giá hiệu dụng (một nửa). Để có được các con số

tương đương với các giá trị trong Bảng 4.2, chúng tôi đã nhân đôi chênh lệch giá hiệu dụng và đưa chúng vào Bảng 4.3. Một lần nữa, chúng tôi đã xây dựng các nhóm giá một phút và đối với mỗi nhóm, chúng tôi đã tính toán chênh lệch giá hiệu dụng theo trọng số lượng, qES, cho bốn tài sản của mình:

Tài sản Trung bình Độ lệch chuẩn P01 Q1 Trung vị Q3 P99 ISNS 12.56 45.00 -42.00 3.50 9.23 19.00 65.00 FARO 7,63 8,61 -10,00 3,33 6,50 10,76 32,84 MENT 1.23 1.57 0.00 1.00 1.00 1.03 5.38 AAPL 9,32 3,85 2,67 6,61 8,83 11,47 20,20

Bảng 4.3 Chênh lệch hiệu quả theo trọng số số lượng (tính bằng xu)

$$\mathrm{qES__t=\sum_{j=1}^m\frac{q_j}{\sum_{s=1}^mq_s}\mathrm{ES__j:,$$

trong đó $j:\in:{1,\ldots,m}$ lập chỉ mục các giao dịch diễn ra trong phút $t$ ， $q_{j}$ biểu thị số lượng cổ phiếu trong giao dịch $j$ và $ES_j$ $j$ là mức chênh lệch hiệu quả cho giao dịch $j$ .

Chênh lệch giá hiệu dụng khác với chênh lệch giá niêm yết theo nhiều cách. Trước đó, chúng ta đã thấy rằng chênh lệch giá hiệu dụng bằng với nửa chênh lệch giá niêm yết khi một giao dịch được thực hiện theo LO có thể nhìn thấy và không đi qua LOB. Trong tập dữ liệu của chúng tôi, các giao dịch được ghi lại thông qua việc thực hiện LO đã đăng, vì vậy chúng tôi không có thông tin về MO được gửi đến thị trường. Điều này ngụ ý rằng không có lệnh thực hiện nào của chúng tôi đi qua LOB. Điều này làm sai lệch thước đo ES của chúng tôi xuống, nhưng độ lệch là nhỏ. vì chúng tôi thấy rất ít lệnh thực hiện LO ngoài giá mua/bán trong các mili giây trước đó (một điều kiện cần thiết để MO đi qua LOB tại NASDAQ, vì số lượng còn lại có thể cần định tuyến lại để tìm kiếm lệnh thực hiện tốt nhất trên tất cả các thị trường). Một lý do khác khiến độ lệch này nhỏ là trên thị trường phân mảnh của Hoa Kỳ, khi một MO đi vào thị trường và nó lớn hơn độ sâu tại giá mua/bán, phần không được thực hiện thường được định tuyến đến các thị trường khác và chỉ trong những trường hợp rất đặc biệt, nó mới thực sự đi qua LOB. Lưu ý rằng, nhìn chung, việc định tuyến lại này khiến việc tái tạo số lượng MO lớn đến gần như không thể nếu không có thông tin cụ thể từ tác nhân đã gửi nó. Do đó, ES đo được của chúng tôi phải bằng hoặc thấp hơn ES (hiện tại) được trích dẫn.

Chênh lệch giá. Một giao dịch hiển thị sẽ tạo ra $\mathrm{ES}=\mathrm{QS/2}$. Vì không phải tất cả các LO được niêm yết đều hiển thị, một số giao dịch sẽ được thực hiện ở mức giá cao hơn giá mua/bán. Điều này sẽ tạo ra một ES nhỏ hơn hẳn QS, và thậm chí có thể tạo ra một ES âm. Người ta sẽ nhận được chênh lệch giá hiệu dụng âm nếu một lệnh mua (bán) trên thị trường đến gặp một lệnh bán (mua) ẩn nằm dưới (trên) giá trung bình. Điều này được chứng minh bằng cách xem xét phần trăm thứ nhất của phân phối thực nghiệm cho ES (thống kê P01 (phần trăm thứ nhất) trong Bảng 4.3). Có một điểm khác biệt nữa giữa ES và QS, đó là ES chỉ có thể

được đo lường khi có giao dịch, trong khi chênh lệch giá niêm yết luôn có thể quan sát được. Do đó, chênh lệch giá niêm yết có thể khác với chênh lệch giá thực tế nếu điều kiện thị trường xung quanh giao dịch khác biệt một cách có hệ thống so với điều kiện thị trường không có giao dịch.

Hình 4.6 Mẫu hình chênh lệch trong ngày: phạm vi liên tứ phân vị cho lợi nhuận một phút

Giao dịch. Xem xét khoảng liên tứ phân vị và độ lệch chuẩn của ES và QS trong Bảng 4.2 và 4.3, chúng tôi thấy ES ít biến động hơn QS. Điều này sẽ xảy ra nếu các lệnh khớp lệnh có xu hướng tập trung vào thời điểm chênh lệch giá được trích dẫn hẹp, điều này sẽ được thảo luận chi tiết hơn trong tiểu mục 4.4.

Chúng ta đã thấy rằng các tài sản có tần suất giao dịch lớn hơn có chất lượng thị trường tốt hơn theo nghĩa là chi phí thực hiện cho các giao dịch nhỏ (chênh lệch giá niêm yết) nhỏ hơn. Nếu chúng ta xem xét mô hình giao dịch trong ngày, chúng ta sẽ tìm thấy thêm bằng chứng cho thấy chi phí thực hiện thấp hơn xảy ra khi giao dịch cao (như đã dự đoán trong các cuộc thảo luận lý thuyết trong Chương 2, trong đó chúng ta thấy rằng nếu số lượng nhà giao dịch có thông tin không đổi và số lượng nhà giao dịch không có thông tin tăng lên, thì chênh lệch giá sẽ giảm). Trong Hình 4.6, chúng tôi biểu thị chênh lệch giá niêm yết trung bình theo thời gian một phút cho AAPL vào năm 2013, cũng như tứ phân vị đầu tiên, trung vị và tứ phân vị thứ ba. Như hình minh họa, chênh lệch giá niêm yết ban đầu cao, giảm nhanh trong nửa giờ giao dịch đầu tiên và hầu như không đổi trong suốt thời gian còn lại của ngày cho đến nửa giờ giao dịch cuối cùng, khi chênh lệch giá giảm nhanh chóng. Mô hình này trong chênh lệch giá niêm yết cũng được thấy trong chênh lệch giá hiệu quả. Nhớ lại rằng trong Hình 4.2, chúng ta thấy rằng buổi chiều có liên quan đến việc giao dịch tăng lên và do đó, chúng ta thấy, như đã giả thuyết, rằng trong khoảng thời gian có luồng thông tin liên tục, giao dịch nhiều hơn và chênh lệch giá thấp hơn xảy ra cùng lúc. Mối liên hệ giữa khối lượng giao dịch và chênh lệch giá không thành công vào buổi sáng.

trong đó tình hình hoàn toàn đảo ngược: khối lượng giao dịch giảm đi kèm với chênh lệch giá giảm. Điều này có thể được giải thích bằng cách dựa vào một yếu tố khác ảnh hưởng đến khối lượng giao dịch mà chúng ta đã thảo luận trước đó, đó là thông tin. Khi thị trường mở cửa và trong giờ giao dịch tiếp theo, thị trường hấp thụ tất cả thông tin đã tích lũy kể từ khi thị trường đóng cửa phiên trước. Điều này giải thích cho khối lượng giao dịch lớn hơn. Tuy nhiên, rất nhiều thông tin mới cũng đi kèm với mức độ bất ổn lớn. Về mặt lý thuyết, như đã thấy trong Chương 2, khi có sự bất ổn lớn hơn, việc áp dụng chênh lệch giá mua-bán rộng hơn là tối ưu, và trong các thuật toán tạo lập thị trường được phát triển trong Chương 10, ví dụ như xem Mục 10.3, chúng tôi chỉ ra rằng sự bất ổn về giá lớn hơn làm tăng độ sâu của các báo giá mà các nhà tạo lập thị trường e ngại rủi ro gửi đến LOB. Do đó, thông tin thêm tại

đầu ngày giải thích sự trùng hợp của biên độ rộng hơn với khối lượng lớn hơn.

Biến động

Bây giờ chúng ta xem xét một khía cạnh khác của chất lượng thị trường, đó là độ biến động. Độ biến động đo lường biến động giá và thể hiện một chi phí (tức là chất lượng thị trường thấp) theo nghĩa là giá cả thay đổi nhanh chóng khiến việc xác định giá thị trường thực tế của tài sản trở nên khó khăn. Tất nhiên, người ta có thể quan sát thấy sự thay đổi giá do giá trị thị trường thực sự của tài sản đang thay đổi, và do đó các tài liệu phân biệt giữa độ biến động cơ bản và nhiễu cấu trúc vi mô. Độ biến động cơ bản ghi lại những biến động trong giá thị trường thực tế, trong khi nhiễu cấu trúc vi mô thể hiện những biến động ngoại lai do cách thức vận hành của thị trường. Có rất nhiều (và ngày càng tăng) các thước đo về độ biến động thô (độ biến động vô điều kiện, không phân biệt độ biến động cơ bản với nhiễu cấu trúc vi mô ) và độ biến động cấu trúc vi mô. Để đơn giản, chúng tôi sử dụng thuật ngữ độ biến động để chỉ độ biến động thô, và chúng tôi

Đo lường mức độ biến động của lợi nhuận tài sản, thay vì giá tài sản. Chúng ta đã thấy một số biện pháp đo lường mức độ biến động khi nghiên cứu mối quan hệ giữa khối lượng và mức độ biến động trong Phần 4.1. Biện pháp đơn giản nhất như vậy là mức độ biến động thực tế: độ lệch chuẩn của một mẫu lợi nhuận. Chúng ta đã thấy mức độ biến động được đo bằng bình phương (hoặc giá trị tuyệt đối) của lợi nhuận. Điều này hữu ích nếu bạn có rất ít quan sát và bạn đang làm việc trong một khoảng thời gian đủ nhỏ để có thể giả định một cách an toàn rằng lợi nhuận trung bình (về cơ bản) bằng không. Một phương án thay thế phổ biến khác là sử dụng phạm vi lợi nhuận (hoặc giá): ví dụ bằng cách lấy chênh lệch giữa giá trị tối đa (max) và giá trị tối thiểu (min) của giá trong một khoảng nhất định và chuẩn hóa nó theo giá trị tối thiểu, giá trị trung bình/trung vị, giá trị ban đầu hoặc giá trị trung bình của giá trị tối thiểu và giá trị tối đa. Ở đây, chúng ta xem xét mức độ biến động thực tế, phạm vi lợi nhuận và số lần giá thầu hoặc giá chào bán thay đổi.

Tài sản Trung bình Độ lệch chuẩn P01 Q1 Trung vị Q3 P99 ISNS 16,6 54,8 0,0 0,0 0,0 14,4 160,3 FARO 8,3 12,7 0,0 0,8 6,6 10,3 31,3 MENT 5.6 6.6 0.0 3.2 4.6 6.5 20.1 AAPL 5,5 4,2 1,0 3,3 4,7 6,7 18,1

Bảng 4.4 Độ biến động thực tế trong một phút (mẫu 15 phút).

Bảng 4.4 hiển thị các thuộc tính thống kê của biến động thực tế được đo là $0:t$, độ lệch chuẩn của lợi nhuận một phút trong khoảng thời gian mười lăm phút (cho mỗi ngày trong năm 2013), tức là cho mỗi khoảng thời gian 15 phút (mỗi khoảng thời gian 15 phút

được lập chỉ mục bởi $t$ )

$$\sigma_t^2=\sum\limits_{j=1}^{15}\left(r_j-\frac{1}{15}\sum\limits_{s=1}^{15}r_s\right)^2,$$

trong đó $j\in{1,\ldots,15}$ là chỉ số cho từng phút riêng lẻ trong khoảng thời gian 15 phút (t) và $T^{\prime}j$ là lợi nhuận thực tế cho phút $j$ trong $t$. Điều chúng ta quan sát được khi chuyển từ AAPL sang ISNS trong Bảng 4.4 là tài sản được giao dịch thường xuyên hơn cũng có độ biến động trung bình cao hơn

| Tài sản | Trung bình | Độ lệch chuẩn | F01 | Q1 | Trung vị | Q3 | P99 | |-------|------|--------|-------|--------|--------|-----| | ISNS | 0,10 | 1,37 | 0,00 | 0,00| 0,00 | 0,00 | 0,00 | | FARO | 3,77 | 2,33 | 1.10 | 2,50| 2,84 | 4.26 | 12.05| | MERO | 3,00 | 3,47 | 0,00 | 0,00| 2.18 | 5.04 | 21.84| | AAPL | 6,23 | 2,85 | 3,72 | 4,72 | 5,28 | 6,45 | 19,47|

Bảng 4.5 Khoảng tứ phân vị của lợi nhuận một phút.

Bảng 4.5 trình bày một cách khác để xem xét cùng ý tưởng, nhưng giờ đây chúng ta sẽ xem xét các thuộc tính thống kê của một biến khác, được lấy mẫu trong các khoảng thời gian ngắn hơn. Trong Bảng 4.5, chúng tôi bao gồm các thống kê cho phạm vi liên tứ phân vị của lợi nhuận một phút. Nghĩa là, đối với AAPL, 5,28 điểm cơ bản là trung vị của 252 quan sát, mỗi quan sát cho một ngày giao dịch, của phạm vi liên tứ phân vị được quan sát cho lợi nhuận một phút trong ngày đó. Do phương pháp lấy mẫu khác biệt, chúng tôi quan sát thấy một số điểm khác biệt thú vị.

ences. ISNS hiển thị khoảng tứ phân vị bằng 0 trong hầu hết các ngày. Điều này là tự nhiên vì đây là một tài sản có rất ít biến động giá - biến động trung vị thực tế trong 15 phút bằng 0 như chúng ta đã thấy trong Bảng 4.4. Bằng cách tập trung vào khoảng tứ phân vị trung vị cho mỗi ngày, phương pháp lấy mẫu này bỏ qua những biến động giá rất lớn nhưng tương đối hiếm, vốn là nguyên nhân dẫn đến các con số biến động cao của ISNS trong Bảng 4.4. Một hiệu ứng khác là nguyên nhân gây ra sự khác biệt giữa MENT và FARO.

Mặc dù MENT có hoạt động giao dịch tương tự FARO, nhưng độ biến động của nó thấp hơn. MENT có hơn 25% số ngày có khoảng liên tứ phân vị bằng 0, nhưng độ biến động một phút thực tế cũng thấp hơn. Sự khác biệt giữa MENT và FARO có lẽ liên quan nhiều hơn đến kích thước tick tương đối của MENT. Như chúng ta đã thấy ở trên khi xem xét mức chênh lệch giá được báo giá, kích thước tick một xu là một ràng buộc ràng buộc đối với MENT trong hầu hết thời gian. Điều này dẫn đến mức độ cứng nhắc bất thường của giá, vì nhiều biến động giá nhỏ không đủ để đẩy giá mua hoặc giá bán ra một xu (5 điểm cơ bản) so với mức hiện tại. Do đó, mặc dù có mức độ hoạt động tương tự như FARO, giá của nó lại có độ biến động thấp hơn. Trong tiểu mục 3.5, chúng ta đã xem xét bản chất phi Markovian của các thay đổi giá. Chúng tôi

nhận thấy có một xu hướng đáng kể (ít nhất là đối với AAPL vào ngày 30 tháng 7 năm 2013) là giá sẽ đảo ngược. Do đó, khi xem xét sự biến động của

Tài sản	Trung bình	Độ lệch chuẩn	P01	Q1	Trung vị	Q3	P99
ISNS	2	29	0	0	0	0	16
FARO	11	25	0	0	3	13	100
MENT	6	18	0	0	2	7	75
AAPL	150	149	7	64	109	185	709

Bảng 4.6 Số lần thay đổi trong giá chào bán hoặc giá chào mua

Lợi nhuận một phút bỏ sót nhiều biến động giá như vậy. Để tính đến tất cả các thay đổi giá, chúng tôi xây dựng một thước đo biến động khác: chúng tôi đếm số lần thay đổi giá mua và giá bán trong khoảng thời gian một phút, và báo cáo số liệu thống kê trong Bảng 4.6.

Chúng tôi nhận thấy rằng các tài sản ít được giao dịch hơn (ISNS, FARO và MENT) cũng có giá ổn định hơn (giá mua và giá bán) ít nhất 25% thời gian chúng tôi không thấy bất kỳ thay đổi giá nào. Đối với ISNS, điều này thậm chí còn rõ ràng hơn, vì nó xảy ra ít nhất 75% thời gian. Tuy nhiên, mức trung bình là 2 mỗi phút, cho thấy giá thay đổi không thường xuyên nhưng khi có thì rất nhiều. Đối với MENT và FARO, chúng tôi thấy nhiều biến động giá hơn so với ISNS, điều này phù hợp với những gì chúng tôi đã phát hiện trước đó. MENT ít thay đổi giá hơn FARO mặc dù cổ phiếu trước có nhiều giao dịch hơn, nhưng điều này liên quan đến vấn đề về kích thước tick tối thiểu đã thảo luận ở trên. Các số liệu thống kê trong Bảng 4.6 cho thấy AAPL hiển thị gần hai lệnh

có mức độ thay đổi giá lớn hơn nhiều so với MENT hoặc FARO. Tuy nhiên, độ biến động thực tế của lợi nhuận của nó thấp hơn FARO và tương tự như MENT (trong Bảng 4.4). Chúng tôi diễn giải điều này như phản ánh sự tương tác giữa kích thước tick tương đối nhỏ và tần suất giao dịch lớn. Thay đổi giá một xu đối với AAPL (với mức giá trung bình khoảng 500 đô la vào năm 2013) là 0,2 điểm cơ bản. Một tài sản có kích thước tick tương đối nhỏ như vậy và với hoạt động giao dịch lớn như vậy chắc chắn sẽ có mức giá rất nhạy cảm (và do đó tạo ra nhiều thay đổi trong giá mua/bán trong vòng một phút), nhưng hầu hết các thay đổi kết quả sẽ nhanh chóng được đảo ngược (như chúng ta đã thấy trong Bảng 3.5 và 3.6), tạo ra độ biến động thực tế tương đối thấp (Bảng 4.4). Để kết thúc cuộc thảo luận của chúng tôi về độ biến động, trong Hình 4.7, chúng tôi xem xét cách độ biến động

(theo phạm vi liên tứ phân vị của lợi nhuận một phút) thay đổi trong suốt một ngày giao dịch. Hình minh họa sử dụng các dấu chấm để hiển thị phạm vi liên tứ phân vị cho mỗi phút trong ngày, ước tính dựa trên tất cả các ngày giao dịch trong năm 2013 (390 quan sát, mỗi quan sát một phút). Các đường biểu diễn các đường cong tứ phân vị được điều chỉnh. Đường màu xanh được điều chỉnh theo phương pháp OLS tiêu chuẩn, trong khi đường màu đỏ được điều chỉnh theo phương pháp OLS mạnh mẽ, phương pháp này kiểm soát các giá trị ngoại lai bằng cách giảm trọng số của các quan sát cực đoan hơn vào đầu và cuối ngày.

So sánh mô hình biến động trong ngày ở Hình 4.7 với mô hình khối lượng trong ngày ở Hình 4.2, chúng ta thấy một mô hình chung: cao vào đầu

trong ngày, giảm dần theo thời gian cho đến khi đạt đến một ngưỡng ổn định từ giữa trưa đến 15:00, sau đó tăng dần cho đến khi thị trường đóng cửa. Trong khi Hình 4.7 cho thấy một nụ cười lớn nghiêng về bên trái cho mô hình biến động, Hình 4.2 cho thấy một nụ cười khối lượng đối xứng hơn và, nếu có, nghiêng về bên phải. Điều này phù hợp với việc giao dịch vào đầu ngày chịu nhiều bất ổn hơn và cũng bị chi phối nhiều hơn bởi thông tin, trong khi giao dịch vào cuối ngày ít bị chi phối bởi thông tin, và có thể nhiều hơn bởi việc các nhà giao dịch vội vàng đóng vị thế của họ.

Tài sản	Trung bình	Độ lệch chuẩn	P01	Q1	Trung vị	Q3	P99
ISNS	619	787	51	150	300	750	3250
FARO	142	125	14	86	122	171	484
MENT	661	694	117	351	527	784	2852
AAPL	189	169	64	127	161	210	662

Bảng 4.7 Độ sâu trung bình tại giá mua và giá bán (số lượng cổ phiếu)

Chất lượng thị trường không chỉ liên quan đến nội dung thông tin về giá cả hay chi phí thực hiện một lệnh nhỏ, mà còn liên quan đến độ sâu. Độ sâu ở đây là khối lượng được niêm yết trên LOB và có thể thực hiện ngay lập tức. Trong phần này, chúng tôi chủ yếu tập trung vào khối lượng tại thời điểm chạm, tức là ở mức giá mua và giá bán. Các quỹ tương hỗ và quỹ hưu trí quản lý một phần lớn tài sản của mọi người và họ cần thị trường để điều chỉnh vị thế, trả tiền cho nhà đầu tư và đánh giá hiệu quả hoạt động của họ. Các quỹ này di chuyển một lượng lớn cổ phiếu. Trong bất kỳ ngày nào, một quỹ có thể muốn mua hoặc bán hàng nghìn, hàng chục nghìn, hoặc thậm chí nhiều hơn cổ phiếu của bất kỳ công ty nào. Bảng 4.7 minh họa việc cho rằng thị trường sẽ khớp các giao dịch đó ở mức giá mua/bán được công bố là không hợp lý. Bảng này cho thấy sự phân bố của trung bình trọng số thời gian một phút của số lượng cổ phiếu có sẵn ở mức giá mua và giá bán trên NASDAQ cho mỗi ngày trong năm 2013. Con số này không vượt quá 1.000 cổ phiếu trong 75% trường hợp đối với bất kỳ một trong bốn trường hợp.

Hình 4.8 Quy mô giao dịch trung bình hàng tháng, AAPL 2000-2013

tài sản (thậm chí không phải AAPL). Hãy nhớ lại (xem Bảng 3.1) rằng vào năm 2013, giao dịch trong ngày trên NASDAQ chiếm khoảng 22 phần trăm tổng khối lượng.

Độ sâu và quy mô giao dịch không độc lập với nhau: quyết định về khối lượng giao dịch phụ thuộc vào lượng cổ phiếu dự kiến có sẵn trong LOB để thực hiện ngay lập tức, và tương tự, quyết định về khối lượng chào bán sẽ phụ thuộc vào luồng MO dự kiến đến. Nếu độ sâu mỏng (ít lệnh nằm trong LOB), MO sẽ nhỏ, điều này ngụ ý rằng trong thị trường mỏng, các lệnh lớn tương đối khẩn cấp sẽ đi qua LOB cần được chia thành các MO nhỏ hơn, sau đó được thực hiện tuần tự trong một khoảng thời gian. Những thay đổi về thể chế, pháp lý, công nghệ và kinh tế trong 15 năm qua

.năm đã tạo ra sự suy giảm đều đặn về quy mô giao dịch trung bình (số lượng cổ phiếu trong một giao dịch duy nhất). Chúng ta có thể thấy điều này đối với AAPL trong Hình 4.8 hiển thị quy mô giao dịch trung bình hàng tháng, được tính toán từ dữ liệu CRSP - các dấu chấm là các mức trung bình hàng tháng và đường đậm là biểu diễn được làm mịn (trung bình động). Nó cho thấy sự gia tăng mạnh vào đầu những năm 2000 lên mức đỉnh điểm khoảng 1.300 cổ phiếu cho mỗi giao dịch và giảm đều xuống khoảng 200 cổ phiếu vào cuối năm 2013. (Ngày nay, với tỷ lệ chia tách 7:1, các con số sẽ khác nhau, mặc dù có thể quan sát thấy một mô hình tương tự ở hầu hết các cổ phiếu.) Bảng 4.8 cung cấp số liệu thống kê về quy mô giao dịch NASDAQ (tổng số cổ phiếu được giao dịch, $U_{e}$ , chia cho số giao dịch, 72. ) cho năm 2013. Như có thể thấy ở đó, quy mô giao dịch của AAPL nhỏ hơn so với ba tài sản còn lại, mặc dù không đáng kể.

| Tài sản | Trung bình | Độ lệch chuẩn | P01 | Q1 | Trung vị | Q3 | P99 | |-------|-------|-------|-----|-----|-----|-----|-------|------| | ISNS | 206,2 | 348,7 | 1,0 | 100 | 100,0 | 200 | 1600 | | FARO | 99,8 | 76,4 | 1.0 | 64.0| 100,0 | 104.0| 374,8| | MAAPL | 199,9 | 172,9 | 6,0 | 100 | 150,0 | 243,0| 867,1| | AAPL | 121,1 | 40,5 | 52,2| 95,7| 115,4 | 139,0| 252,8|

Bảng 4.8 Quy mô trung bình của một giao dịch $(Q/n)$

Khi phát triển các thuật toán cung cấp tính thanh khoản cho thị trường, độ sâu, được thể hiện bằng hình dạng của LOB, là rất quan trọng vì điều này quyết định nơi một nhà giao dịch

Hình 4.9 Độ sâu trong ngày: (log) số lượng cổ phiếu trung bình được niêm yết ở mức giá mua và giá bán.

nên đăng LOB của mình. Chúng ta đã thảo luận về một mô hình tạo lập thị trường đơn giản trong Phần 2.1.4, và trong các chương tiếp theo, chúng tôi sẽ phát triển thêm những ý tưởng này trong bối cảnh tối ưu hóa các thuật toán tạo lập thị trường và thực thi tối ưu. Ví dụ, Chương 8 xem xét việc thực thi tối ưu (mua hoặc bán các vị thế lớn) khi đại lý sử dụng LOB và có thể cả MO. Trong Chương 10, hình dạng của LOB đóng vai trò quan trọng trong việc đăng ký thanh khoản tối ưu cho nhà tạo lập thị trường, và chúng tôi xem xét các giả định khác nhau về hình dạng của sổ sách ảnh hưởng đến chiến lược đăng ký tối ưu như thế nào. Để kết thúc phần thảo luận này, chúng ta xem xét các mô hình chiều sâu trong ngày trong Hình 4.9

Biểu đồ này cho thấy mô hình trong ngày về số lượng cổ phiếu trung bình được niêm yết theo giá mua và giá bán mỗi phút trong năm 2013. Đúng như dự đoán, có một mức tăng mạnh thường thấy vào cuối ngày giao dịch. Điều này phù hợp với chất lượng thị trường cao hơn dưới dạng chênh lệch giá hẹp hơn (như đã thấy trước đó, trong Biểu đồ 4.6) và mong muốn đóng vị thế của các nhà giao dịch vào cuối ngày tăng lên. Có phần hơi ngạc nhiên, mặc dù chỉ là một chút, là độ sâu cũng cao hơn vào đầu ngày, khi chúng tôi đưa ra giả thuyết rằng sự không chắc chắn về giá cao dẫn đến chênh lệch giá rộng hơn. Biểu đồ cho thấy sự đánh đổi về mặt lý thuyết giữa lợi ích của việc tạo lập thị trường từ việc tăng số lượng lệnh đến và chi phí từ sự không chắc chắn cao hơn được thảo luận trong tiểu mục 2.1.1 được giải quyết trong thực tế theo hướng có lợi cho việc cung cấp thanh khoản lớn hơn.

4.3.4 Tác động của giá

Mối quan tâm chính của những người tham gia muốn thực hiện một lệnh lớn là lệnh đó sẽ có tác động tiêu cực đến giá: giá tăng khi mua mạnh và giá giảm khi bán. Có một số biến số có thể được sử dụng để đo lường tác động đến giá của một lệnh. Đo lường độ sâu, như chúng ta vừa thực hiện, cho chúng ta thước đo tác động đến giá, theo nghĩa là độ sâu tại giá bid/ask cho chúng ta biết một lệnh thị trường có thể lớn đến mức nào mà không ảnh hưởng đến giá, tức là không cần di chuyển LOB.

Nhưng, trong một thị trường duy nhất, một lệnh lớn sẽ tiêu thụ toàn bộ khối lượng ở mức giá tốt nhất và tiếp tục cho đến nhịp tiếp theo, v.v. cho đến khi lệnh được khớp.

đã được lấp đầy. Do đó, bất cứ khi nào một MO đi qua LOB, giá trung bình trên mỗi cổ phiếu sẽ thấp hơn giá báo giá tốt nhất tại thời điểm MO được gửi đến LOB. Trong Chương 6, chúng ta đã thảo luận kỹ lưỡng về cách xây dựng các chiến lược tối ưu để giảm thiểu tác động thị trường của các lệnh lớn. Cho đến nay, chúng ta chỉ mới xem xét điều gì xảy ra với MO khi nó đến LOB.

nhưng việc thực hiện một giao dịch (tương đối lớn) có thể khá phức tạp. Tại Hoa Kỳ, với 11 sàn giao dịch công khai, các cơ quan quản lý cảm thấy cần phải điều chỉnh cách thức xử lý các lệnh tiêu thụ hết thanh khoản hiện có tại một sàn giao dịch với giá mua/bán tốt nhất, nhằm bảo vệ nhà đầu tư. Quy định này và sự đa dạng của các sàn giao dịch làm nảy sinh các vấn đề liên quan đến độ trễ thời gian giữa các sàn giao dịch khác nhau. Vì vậy, khi gửi lệnh MO, người ta phải thiết kế chiến lược định tuyến rất cẩn thận: gửi đến sàn giao dịch nào và khi nào, và điều gì sẽ xảy ra nếu lệnh đó tiêu thụ hết thanh khoản tại một thời điểm nào đó. Vì vậy, một đại lý cần biết điều gì xảy ra khi lệnh được thực hiện, nhưng cũng cần biết điều gì xảy ra sau khi giao dịch. Với thông tin chúng tôi có từ NASDAQ, giờ chúng ta sẽ xem xét những gì xảy ra

sau khi các lệnh được thực hiện tại đó. Bảng 4.9 xem xét các lệnh thực hiện của AAPL trên NASDAQ vào ngày 30 tháng 7 năm 2013. Như đã đề cập trước đó (trong Chương 3), chúng tôi không quan sát MO, mà quan sát những gì xảy ra với các lệnh đã được niêm yết. Để minh họa cho loại phân tích có thể thực hiện, chúng tôi đưa ra giả định đơn giản rằng tất cả các lệnh được thực hiện cùng lúc (cùng một mili giây) và ở cùng một mức giá đều thuộc cùng một MO và được tổng hợp theo đó. Bảng 4.9 xem xét điều gì xảy ra khi các loại lệnh mua và bán khác nhau được thực hiện.

Khi thực hiện, chúng ta sẽ xem xét sự xuất hiện của các MO trong các hoàn cảnh khác nhau. Hàng có nhãn "Điểm chuẩn" ghi lại những gì xảy ra trung bình bằng cách bao gồm mỗi khoảng thời gian 10 ms trong ngày giao dịch (2,34 triệu quan sát). Đây đóng vai trò là điểm chuẩn để so sánh những gì xảy ra trong khoảng thời gian 10 ms SAU khi một MO xuất hiện. Chúng tôi so sánh điểm chuẩn này với những gì xảy ra sau sáu sự kiện sau:

●Lệnh Mua[Bán]: lệnh được thực hiện theo lệnh được đăng trên lệnh bán (bên bán) [lệnh mua (bên mua)] của sổ; ●Lệnh Mua[Bán] (không): giống như Lệnh Mua[Bán] nhưng bỏ qua các lệnh mua [bán] trong vòng 10 ms kể từ lệnh mua [bán] trước đó; ●Lệnh Mua[Bán] - Lớn: lệnh mua [bán] chỉ áp dụng cho hơn 300 cổ phiếu.

Trong Bảng 4.9, chúng tôi đưa vào số liệu thống kê về lượng lệnh đến ở cả bên mua và bên bán trong trường hợp chuẩn, cũng như sau sáu sự kiện này. Các cột được gắn nhãn $^{*}n=0$ mô tả tỷ lệ phần trăm các trường hợp mà chúng tôi không quan sát thấy lệnh đến ở bên mua/bên bán sau khi thực hiện lệnh. Trong trường hợp chuẩn, chúng tôi thấy rằng mặc dù hoạt động giao dịch tại AAPL ở mức cao, kích thước khoảng của chúng tôi đủ nhỏ để trong khoảng 99,4% trường hợp, chúng tôi không quan sát thấy lệnh đến. Sau bất kỳ loại thực hiện lệnh nào, tỷ lệ này rơi vào cả hai bên của sổ sách. Chúng tôi quan sát thấy rằng sau một lệnh mua, có ít nhất một lệnh mua thứ hai đến trong 30% trường hợp và ít nhất một lệnh bán MIO trong 5% trường hợp. Một mô hình tương tự cũng được quan sát thấy sau một lệnh bán: trong ít nhất 25% trường hợp, một lệnh bán được theo sau bởi ít nhất một lệnh mua.

Chúng tôi thấy MO, trong khi ít nhất 5 phần trăm trường hợp, lệnh bán MK được theo sau bởi lệnh mua MO. Chúng tôi cũng thấy các mô hình rất tương tự nếu loại trừ các lệnh đến ngay sau khi lệnh MO đến, tuy nhiên, lệnh sau đó tăng đáng kể: một lệnh mua (bán) lớn được theo sau bởi các lệnh mua khác trong 43 (38) phần trăm trường hợp và lệnh bán trong ít nhất 8 phần trăm trường hợp. Chúng tôi xem xét các tứ phân vị có điều kiện về việc lệnh mua (bán) thị trường đến dường như không có tác động rõ ràng nào đến sự phân bố của các lệnh bán (mua) đến, nhưng chúng tôi có bằng chứng cho thấy các lệnh đến ở cùng một phía có thể thường xuyên hơn. Vì vậy, phân tích rất sơ bộ và hạn chế của chúng tôi cho thấy rằng lệnh đến dường như được theo sau bởi các lệnh tiếp theo của cả hai phía của sổ sách.

Bảng 4.9 Tác động của việc thực hiện lên thị trường MO (AAPL 20130730)

Trong Bảng 4.10, chúng tôi thực hiện một phân tích tương tự, trong đó chúng tôi xem xét cách các sự kiện khác nhau ảnh hưởng đến giá mua và giá bán. Trong bảng này, chúng tôi tuân theo quy ước rằng +1 là một bước dịch chuyển 1 cent so với giá tốt nhất, nghĩa là: nếu giá mua là 453,02 đô la, thì +1 trong giá bán là sự thay đổi từ 453,02 đô la lên 453,03 đô la, trong khi ở phía giá mua, với giá mua là 452,96 đô la, thì +1 trong giá mua là sự giảm giá 1 cent, tức là sự thay đổi từ 452,96 đô la xuống 452,95 đô la. Với quy ước này, những thay đổi giá tích cực thể hiện những bước dịch chuyển ra khỏi giá trung bình và những thay đổi giá tiêu cực thể hiện những bước dịch chuyển về phía giá trung bình, cho phép chúng tôi trình bày một cách hợp lý hơn về các tác động khác nhau của MO lên giá mua và giá bán. Trở lại Bảng 4.10, chúng tôi xem xét cách các lệnh khác nhau ảnh hưởng đến giá tốt nhất.

ở phía bên trái của LOB, tức là phía bên trái của bảng mô tả cách giá chào bán phản ứng với một MO mua mạnh, và phía bên phải mô tả cách giá chào bán phản ứng với một MO bán mạnh. Chúng tôi xem xét hai trường hợp chuẩn: cột *Ask”(*Bid') là chuẩn

Trường hợp này xem xét những thay đổi trung bình trong giá chào mua (bid), tức là sau mỗi khoảng thời gian 10 ms. Hàng đầu tiên cho chúng ta biết tỷ lệ phần trăm thời gian mà giá chào mua không thay đổi (99,5%) và giá chào bán không thay đổi (cũng là 99,5%). Chúng ta cũng xem xét điều gì xảy ra với giá chào mua (bid) sau khi lệnh Mua (*Bán) được đưa vào, và tỷ lệ phần trăm thời gian giá chào mua (bid) giữ nguyên giảm xuống

Bảng 4.10 Tác động thị trường của việc thực hiện ở mức giá tốt nhất - phía bên mình (AAPL 20130730)

28 (23) phần trăm. Tỷ lệ phần trăm này thậm chí còn giảm hơn nữa nếu chúng ta chỉ xem xét các lệnh thực hiện quét sổ lệnh ( $\Delta\neq0$ ), tức là sau một lệnh mua (bán) tạo ra sự thay đổi ngay lập tức trong giá chào mua (giá thầu). Các lệnh thực hiện *lớn' như vậy tồn tại lâu hơn theo nghĩa là 10 ms sau một thay đổi như vậy, xác suất giá chào mua (giá thầu) trở lại mức trước khi đặt hàng giảm xuống còn 11 (7) phần trăm. Các cột có nhãn $\Delta> 3c^{5}$ xem xét tập hợp con các lệnh thực hiện quét sổ lệnh và chúng ta cũng quan sát thấy một sự thay đổi lớn (lớn hơn ba xu) trong giá chào mua (giá thầu). Khả năng quay trở lại nhỏ hơn so với tất cả các lệnh quét nhưng không đáng kể. Các hàng của Bảng 4.10 (ngoại trừ các hàng "Quan sát" và °0′) phản ánh phân phối

của các biến động giá phụ thuộc vào các thay đổi giá khác không khác không. Phân phối chuẩn cho các biến động giá mua và giá bán là đối xứng và rất giống nhau, điều này không đúng với các phân phối sau khi MO xuất hiện. Sau lệnh mua (bán), phân phối của giá mua (giá thầu) rõ ràng dịch chuyển ra khỏi mức trước đó và hầu như không bao giờ tốt hơn (gần với mức giá trung bình) so với trước khi MO xuất hiện 10 ms sau đó. Sự khác biệt mà chúng tôi quan sát thấy đối với lệnh quét dường như tập trung vào xác suất quay trở lại mức trước khi xuất hiện, nhưng dường như không ảnh hưởng nhiều đến phân phối thay đổi giá đối với các thay đổi khác không. Tuy nhiên, các biến động giá lớn dường như được theo sau bởi các thay đổi trong phân phối thay đổi giá mua/bán, và chúng tôi thấy ít bằng chứng cho thấy các biến động giá lớn này bị đảo ngược trong vòng 10 ms. Trong Bảng 4.1l, chúng tôi lặp lại phân tích nhưng xem xét tác động của việc lệnh xuất hiện

Mặt khác, sự xuất hiện của một MO mua (bán) ảnh hưởng đến giá mua (giá bán). Chúng tôi giữ nguyên các dấu hiệu sao cho một biến động tích cực trong Bảng 4.10 cũng là một biến động tích cực ở mặt khác của bảng trong Bảng 4.11. Nghĩa là, giả sử

Bảng 4.11 Tác động thị trường của việc thực hiện ở mức giá tốt nhất - phía bên kia (AAPL 20130730).

Giá chào bán là $453,02 và giá chào bán là $452,96. Sau lệnh mua, mức thay đổi +1 cent trong giá chào bán sẽ làm tăng từ $453,02 lên $453,03 (Bảng 4.10), và mức thay đổi +1 cent trong giá chào bán sẽ làm tăng từ $452,96 lên $452,97 (Bảng 4.11). Trong khi đó, sau lệnh bán, mức thay đổi +1 cent trong giá chào bán sẽ làm giảm từ $452,96 xuống $452,95 (Bảng 4.10), và mức thay đổi +1 cent trong giá chào bán sẽ làm thay đổi từ $453,02 lên $453,01 (Bảng 4.11).

Với quy ước này, ta thấy rằng tác động của việc giá đến một bên của LOB được theo sau bởi một tác động tương tự nhưng yếu hơn ở bên kia. Xác suất giá vẫn/trở lại mức trước khi đến giảm từ 99,5 xuống 82 cho cả giá mua và giá bán sau khi lệnh mua và lệnh bán đến tương ứng. Xác suất này nhỏ hơn một chút đối với lệnh quét (liên thị trường). Ta cũng thấy sự dịch chuyển trong phân phối các thay đổi giá khác không (yếu) theo sau sự dịch chuyển của các thay đổi ở phía bên kia của sổ sách. Vì vậy, ta thấy sự xuất hiện của lệnh mua được theo sau bởi sự dịch chuyển trong các thay đổi giá mua (khác không) ra khỏi giá trung bình, do đó xác suất có điều kiện của một động thái 1 xu ra khỏi giá mua trước khi đến tăng từ 17,9 lên 29,5 phần trăm sau lệnh mua và xác suất của một động thái 1 xu ra khỏi giá bán trước khi đến tăng từ 22,6 lên 29,2 phần trăm sau lệnh bán. Mô hình này rất giống nhau sau một lệnh mua (bán), một lệnh mua (bán) quét, hoặc một lệnh mua (bán) quét với biến động giá lớn. Kết hợp quan sát này với biến động giá trong Bảng 4.10, chúng tôi tìm thấy bằng chứng cho thấy chênh lệch giá được báo giá tăng sau một lệnh mua hoặc bán, và tăng đáng kể sau một lệnh quét lớn. Để kết thúc bài phân tích về tác động của MO, trong Bảng 4.12, chúng tôi xem xét hiệu ứng

Về những thay đổi mà chúng tôi quan sát được ở đường chân trời 10 ms, chúng tôi xem xét các đường chân trời dài hơn (30 ms, 100 ms và 1.000 ms). Bảng 4.12 được chia theo chiều ngang thành ba phần:

Bảng 4.12 Tác động của việc thực hiện lên giá trung bình theo thời gian của thị trường (AAPL 20130730)

Bảng đầu tiên (Bench') là bảng chuẩn mực xem xét những thay đổi trong giá mua và giá bán trong các khoảng thời gian tương ứng; hai phần dưới cùng xem xét tác động của việc xuất hiện lệnh mua và lệnh bán tương ứng lên giá mua và giá bán. Trong bảng này, chúng tôi tiếp tục giữ nguyên dấu hiệu ở phía giá mua và giá bán, nhưng để tránh nhầm lẫn, chúng tôi giữ nguyên dấu hiệu thay đổi ở phía giá mua (giá bán) như trong trường hợp chuẩn mực, cũng như sau lệnh mua hoặc lệnh bán, nghĩa là, việc diễn giải dấu hiệu không phụ thuộc vào việc nó theo sau lệnh mua hay lệnh bán, mà chỉ phụ thuộc vào phía nào của sổ sách mà chúng tôi đang xem xét. Vì vậy, giả sử giá bán là $453,02 và giá mua là $452,96. Sau lệnh mua, giá chào bán tăng 1 xu sẽ biến động từ $453,02 lên $453,03, và giá chào mua tăng 1 xu sẽ biến động từ $452,96 lên $452,95 (biến động 1 xu so với giá trung bình). Điều tương tự cũng xảy ra sau lệnh bán (và trong trường hợp tham chiếu): giá chào bán tăng 1 xu sẽ dẫn đến giá tăng từ $453,02 lên $453,03, và giá chào mua tăng 1 xu sẽ biến động từ $452,96 lên $452,95 (biến động 1 xu so với giá trung bình). Cũng cần lưu ý rằng tất cả các phần trăm đều phản ánh xác suất (chúng tôi không đặt điều kiện cho biến động giá khác 0 trong bảng này). Điều đầu tiên cần lưu ý trong Bảng 4.12 là tác động tự nhiên của thời gian lên tất cả các mức giá:

Khi mở rộng phạm vi, giá có xu hướng biến động nhiều hơn và phân phối trở nên phân tán hơn. Chúng ta cũng thấy rằng các biến động giá ban đầu không được theo sau bởi sự đảo chiều nhanh chóng, và thậm chí chỉ một giây (1.0000 ms) sau lệnh mua, giá mua và giá bán đã dịch chuyển đáng kể so với mức trước khi khớp lệnh, với mức giá tệ hơn và một dấu hiệu cho thấy giá bị trì hoãn sẽ ảnh hưởng đến các lần khớp lệnh trong tương lai và chênh lệch giá rộng hơn.

Tất cả những kết quả này phải được diễn giải trong bối cảnh cụ thể, chứ không phải theo quan hệ nhân quả. Như chúng ta sẽ thấy, MO không xuất hiện ngẫu nhiên. Chúng thường xuất hiện khi chênh lệch giá hẹp, và đánh trúng các lệnh được đặt gần giá trung bình hơn, do đó, việc chúng ta thấy chênh lệch giá rộng hơn sau khi thực hiện lệnh là điều dễ hiểu.

4.3.5 Đi bộ theo LOB và Tác động giá vĩnh viễn

Chúng ta đã thấy rằng một trong những yếu tố then chốt trong các thuật toán giao dịch là cách hành động của chính nhà đầu tư cùng với dòng lệnh của những người tham gia thị trường khác ảnh hưởng đến giá của tài sản mà họ đang giao dịch. Trong các thuật toán giao dịch được phát triển ở Phần II, chúng tôi chỉ ra cách các chiến lược phụ thuộc vào tác động của thị trường đối với các giao dịch. Ví dụ, trong Chương 6, chúng tôi chỉ ra cách giao dịch các vị thế lớn khi các giao dịch của chính nhà đầu tư đi qua LOB, ngoài việc ảnh hưởng tiêu cực đến giá trung bình bằng cách tạo áp lực tăng (giảm) trong sự dịch chuyển của giá trung bình nếu nhà đầu tư đang mua (bán). Trong Chương 7, chúng tôi nghiên cứu vấn đề một tác nhân muốn thanh lý một vị thế lớn khi dòng lệnh từ các nhà giao dịch khác trên thị trường cũng ảnh hưởng đến giá trung bình. Trong trường hợp này, nếu chương trình thực hiện của tác nhân đi cùng hoặc ngược lại với dòng lệnh ròng, chiến lược sẽ điều chỉnh để tối đa hóa doanh thu từ việc thanh lý vị thế. Ở đây, chúng tôi muốn đánh giá theo kinh nghiệm các giá trị tham số cho các hiệu ứng khác nhau

Một giao dịch có thể tác động đến giá: tác động giá vĩnh viễn và tạm thời. Chúng tôi xem xét những tác động này đối với năm cổ phiếu bằng cách sử dụng dữ liệu từ NASDAQ và cho năm 2013. Cách tiếp cận đầu tiên là ước tính riêng biệt các tác động này. Trước tiên, chúng tôi ước tính tác động giá vĩnh viễn bằng cách xem xét tác động của luồng lệnh lên sự thay đổi giá trong khoảng thời gian năm phút. Giả sử $\Delta S_{n}=S_{n\tau}-S_{(n-1)\tau}$ là sự thay đổi của giá trung bình trong khoảng thời gian $\left|(n-1)\tau,:n\tau\right]$ với $\tau=5$ mira Giả sử $\mu_{n}$ là luồng lệnh ròng được định nghĩa là chênh lệch giữa khối lượng MO mua và MO bán trong cùng khoảng thời gian. Sau đó, chúng tôi ước tính tác động giá vĩnh viễn dưới dạng tham số $b$ trong hồi quy tuyến tính mạnh sau

$$\Delta S_n=b:\mu_n+\varepsilon_n,$$

trong đó $E_{\eta}$ là số hạng lỗi (giả định là chuẩn). Mô hình (4.2) được ước tính hàng ngày, sử dụng dữ liệu Winsorized, không bao gồm đuôi trên và dưới $0,5%$. Hàng đầu tiên của Bảng 4.13 hiển thị giá trị trung bình của các tham số ước tính cho tác động giá vĩnh viễn và hàng thứ hai hiển thị độ lệch chuẩn của nó.

Ở hàng thứ ba và thứ tư của bảng, chúng tôi hiển thị ước tính tham số cho tác động tạm thời và độ lệch chuẩn tương ứng. Để ước tính tham số này, được ký hiệu là $k$, chúng tôi giả định rằng tác động giá tạm thời là tuyến tính theo khối lượng giao dịch. Cụ thể, chênh lệch giữa giá thực hiện mà nhà đầu tư nhận được và báo giá tốt nhất là $kQ$, trong đó $U$ là tổng khối lượng giao dịch. Để thực hiện ước tính, chúng tôi chụp nhanh LOB mỗi giây, xác định giá mỗi cổ phiếu $S_{t}^{exec}(Q_{i})$ cho các khối lượng khác nhau ${Q_{1}$ {Q1 ${Q_{1},:Q_{2},\ldots,:Q_{N}}$ QN} $Q_{N}}$ (bằng cách đi bộ LOB), tính toán chênh lệch giữa giá thực hiện trên mỗi

chia sẻ và trích dẫn hay nhất tại thời điểm đó, và thực hiện hồi quy tuyến tính. Tức là chúng ta hồi quy,

$$S_{i,t}^{exec,bid}=S_t^{bid}-k^{bid}:Q_i+\varepsilon_{i,t}^{bid}:,\quad S_{i,t}^{exec,ask}=S_t^{ask}+k^{ask}:Q_i+\varepsilon_{i,t}^{ask}:,$$

trong đó $E_{i,t}$ biểu diễn lỗi ước tính của thể tích thứ $i^{th}$ cho dấu thời gian thứ $t^{th}$. Đối số độ dốc của hồi quy tuyến tính $\hat{k}$ là ước tính của tạm thời

Tác động giá trên mỗi cổ phiếu tại thời điểm đó. Chúng tôi thực hiện việc này cho từng giây của mỗi ngày giao dịch và trong bảng, chúng tôi báo cáo giá trị trung bình và độ lệch chuẩn của các ước tính hàng ngày này (cho bên mua) khi chúng tôi loại trừ nửa giờ đầu tiên và nửa giờ cuối cùng của ngày giao dịch và Winsorise dữ liệu. Hơn nữa, hàng thứ năm hiển thị giá trị trung bình của tỷ lệ hàng ngày ${\overline{b}/k}.$ và hàng thứ sáu hiển thị độ lệch chuẩn của nó. Chúng tôi quan sát thấy FARO hiển thị tỷ lệ nhỏ nhất là 1,02 và SMH hiển thị tỷ lệ lớn nhất là 7,43. Ở cuối phần này, chúng tôi sẽ thảo luận chi tiết hơn về tỷ lệ này.

	FARO	SMH	NTAP	ORCL	INTC
$\tilde{b}$	$1,41 \lần 10^{-4}(9,61 \lần 10^{-5})$	$5,45 \lần 10^{-6}(4,20 \lần 10^{-6})$	$5,93 \lần 10^{-6}(2,31 \lần 10^{-6})$	$1,82 \lần 10^{-6}(7,19 \lần 10^{-7})$	$6,15 \lần 10^{-7}(2,16 \lần 10^{-7})$
$\tilde{k}$	$1,86 \lần 10^{-4}(2,56 \lần 10^{-4})$	$8,49 \lần 10^{-7}(8,22 \lần 10^{-7})$	$3,09 \lần 10^{-6}(1,75 \lần 10^{-6})$	$8,23 \lần 10^{-7}(3,78 \lần 10^{-7})$	$2,50 \lần 10^{-7}(1,25 \lần 10^{-7})$
$\frac{\tilde{b}}{\tilde{k}}$	1,02(0,83)	7,43(6,24)	2,04(0,77)	2,28(0,74)	2,55(0,70)

Bảng 4.13 Các thông số tác động giá tạm thời và vĩnh viễn đối với cổ phiếu NASDAQ trong năm 2013. Bên dưới mỗi ước tính thông số, chúng tôi hiển thị độ lệch chuẩn của thông số đó.

Hơn nữa, để thể hiện sự thay đổi của tham số tác động giá cố định, bảng đầu tiên của Hình 4.10 mô tả ước tính $b$ cho mỗi ngày trong năm 2013 - đường đứt nét cho thấy $\tilde{b}$ trung bình. Bảng thứ hai trong hình hiển thị biểu đồ tần suất của luồng lệnh ròng năm phút sử dụng tất cả dữ liệu trong năm 2013. Cuối cùng, bảng cuối cùng hiển thị luồng lệnh ròng dự kiến (có thanh lỗi) có điều kiện là quan sát thấy một thay đổi giá nhất định.3 Như đã thể hiện trong kết quả hồi quy, có một mối quan hệ tích cực giữa luồng lệnh ròng và thay đổi giá. Hình hiển thị thêm chi tiết về mối quan hệ này để hỗ trợ cho phát hiện rằng khi luồng lệnh ròng là tích cực (tiêu cực), tức là nhiều (ít) MO mua hơn bán, thì giá trung bình có xu hướng tăng (giảm). Hơn nữa, chúng ta thấy rằng giả định có mối quan hệ tuyến tính giữa thay đổi giá và luồng lệnh ròng là hợp lý đối với nhiều thay đổi giá trung bình. Chỉ trong hai thái cực, giá thay đổi rất cao hoặc rất thấp, mối quan hệ không còn tuyến tính nữa, nhưng chúng tôi lưu ý rằng có ít hơn

các quan sát ở phần đuôi như được thể hiện bằng biểu đồ và điều này cũng được thể hiện bằng các khoảng tin cậy xung quanh các ước tính

Hình 4.1l khám phá tác động giá tạm thời đối với INTC. Bảng trên cùng hiển thị ảnh chụp nhanh LOB của INTC vào ngày 1 tháng 11 năm 2013 lúc 1 giờ sáng. Bảng dưới cùng bên trái ghi lại đường cong tác động giá tạm thời theo kinh nghiệm được tạo ra bởi các MO giả định với các khối lượng khác nhau khi chúng đi qua phía mua của LOB. Mỗi đường cong biểu diễn đường cong tại mỗi giây từ 1 giờ 00 phút đến 1 giờ 01 phút. Chúng tôi cũng đưa vào một hồi quy tuyến tính với giao điểm gốc được đặt bằng nửa chênh lệch giá (đường gạch ngang) tương ứng với mô hình được sử dụng để ước tính tham số $k$ ở trên. Lưu ý rằng hàm tác động dao động trong một phút, và cùng với đó là tác động mà các giao dịch có quy mô khác nhau có thể có. Hồi quy tuyến tính cung cấp một ước tính gần đúng về tác động tạm thời trong một phút đó. Hình ảnh thứ ba trong Hình cho thấy độ dốc của tác động tuyến tính này

Mô hình này diễn ra trong suốt cả ngày. Chúng ta thấy rằng tác động lớn nhất thường xảy ra vào buổi sáng, sau đó tác động này tăng dần và duy trì trong suốt cả ngày, và giảm dần về cuối ngày. Mô hình này được thấy ở một số tài sản và phù hợp với sự giảm chênh lệch giá và tăng độ sâu mà chúng tôi đã ghi nhận trước đó.

Phân tích trên xem xét riêng biệt các tác động tạm thời và vĩnh viễn, nhưng động lực kết hợp của chúng là một đại lượng quan trọng trong các thuật toán thực thi. Các chiến lược thanh lý và mua lại tính đến sự đánh đổi giữa chi phí phát sinh từ việc kiểm toán sổ sách và tác động vĩnh viễn. Đặc biệt, khi cả hai loại

· tác động là tuyến tính trong tỷ lệ giao dịch, sự đánh đổi này một phần được thể hiện bằng tỷ lệ $b/k$ (xem ví dụ Mục 7.3 trong bối cảnh của thuật toán thanh lý và Chương 9 để biết các chiến lược theo dõi khối lượng như POV và VWAP). Trong bảng bên trái của Hình 4.12, chúng tôi hiển thị biểu đồ phân tán của cặp hàng ngày $(b,:k)$ đối với INTC, biểu đồ này cho thấy mối quan hệ tích cực rõ ràng giữa tác động tạm thời và tác động vĩnh viễn. Điều này phù hợp với mối quan hệ lý thuyết giữa tác động giá và độ sâu, do đó, những ngày có độ sâu nhỏ sẽ liên quan đến tác động giá cao, cả vĩnh viễn và tạm thời, trong khi thị trường sâu sẽ liên quan đến tác động giá thấp hơn. Cuối cùng, trong bảng bên phải của hình, chúng ta thấy biểu đồ tần suất cho tỷ lệ $b/k$ nằm trong khoảng từ 1 đến 4 và đối xứng quanh mức khoảng 2,5.

Tin nhắn và Hoạt động hủy bỏ

Một tính năng quan trọng trong cách thức hoạt động của các sàn giao dịch là khả năng hủy các lệnh LOB chưa được khớp. Các nhà giao dịch cung cấp thanh khoản phải có khả năng thay đổi quan điểm của họ về thị trường và do đó hủy hoặc định vị lại các lệnh LOB dựa trên thông tin mới. Sau này, khi chúng ta xem xét các thuật toán cung cấp thanh khoản cho thị trường (ví dụ, xem Chương 7, 8 và 10), chúng ta sẽ thấy rằng các thuật toán này dựa trên khả năng định vị lại các lệnh LOB trong LOB. Ví dụ, khi chúng ta phát triển các thuật toán tạo lập thị trường yêu cầu độ trễ thấp, tác nhân sẽ

Hình 4.12 Tác động giá INTC sử dụng quan sát hàng ngày trong năm 2013.

liên tục hủy LO để định vị lại khi có thông tin mới và quan điểm của tác nhân về các sai lệch ngắn hạn ở mức giá trung bình được tính đến.

Ở đây, chúng tôi sử dụng dữ liệu ITCH chi tiết để đo lường hoạt động giao dịch theo số lượng tin nhắn được sàn giao dịch ghi nhận, trong đó "^message" là một dòng dữ liệu trong tập dữ liệu ITCH, như chúng ta đã thấy ở đầu chương. Tổng số tin nhắn lớn hơn một chút so với gấp đôi số lệnh đã đăng, vì hầu hết các lệnh đã đăng đều bị hủy hoặc được thực hiện đầy đủ.

| Tài sản | Trung bình | Độ lệch chuẩn | P01 | Q1 | Trung vị | Q3 | P99 | |-------|---------|--------|--------|-------|--------|--------| | ISNS | 1.711 | 6.078 | 173 | 450 | 760 | 1.745 | 8.943 | | FARO | 24.038 | 10,871 | 5.242 | 16.277 | 22.347 | 29.232 | 71.445 | | MENT | 59.961 | 21.755 | 23.157 | 43.477 | 53.972 | 72.639 | 131.715 | | AAPL | 531.728 | 166.652 | 280.242 | 417.576 | 500.680 | 614.437 | 1.067.248 |

Bảng 4.14 Số lượng tin nhắn hàng ngày (tính bằng 000)

Bảng 4.14 chứa số liệu thống kê mô tả cho các tin nhắn hàng ngày của bốn tài sản của chúng tôi (đơn vị nghìn; P01 và P99 lần lượt là phần trăm thứ 1 và thứ 99). Chúng ta có thể thấy, giống như hoạt động giao dịch, số lượng tin nhắn cho mỗi tài sản khác nhau theo cấp số nhân (ngoại trừ tin nhắn của MENT gấp khoảng 2,5 lần so với FARO). Để điều chỉnh theo hoạt động giao dịch, một quy trình thông thường là chuẩn hóa theo số lượng giao dịch (như chúng tôi làm trong Bảng 4.15) hoặc theo khối lượng giao dịch. Kết quả trong Bảng 4.15 cho thấy một hiện tượng thú vị: các tài sản được giao dịch thường xuyên hơn 'yêu cầu' ít tin nhắn hơn cho mỗi giao dịch so với các tài sản ít được giao dịch hơn. Hiện tượng ngược lại được thể hiện trong Bảng 4.16, trong đó chúng tôi xem xét

tỷ lệ hủy (trong tổng số tin nhắn: bài đăng, hủy và thực hiện). Chỉ riêng AAPL, chúng tôi thấy ít hơn 45% đơn hàng bị hủy trong hầu hết thời gian.

Tài sản	Trung bình	Độ lệch chuẩn	P01	Q1	Trung vị	Q3	P99
ISNS	226,7	749,1	10,8	44,4	80,7	159,1	2885,1
FARO	88,2	55,8	20.7	57,8	79,4	106.1	223,5
MRO	70,0	21,8	29,8	54,2	66,5	83,2	134,2
AAPL	22,6	4,9	12,6	19,3	22,3	25,3	39,4

Bảng 4.15 Số tin nhắn trên mỗi số giao dịch.

Tài sản	Trung bình	Độ lệch chuẩn	P01	Q1	Trung vị	Q3	P99
ISNS	45,8	3,2	36,3	44,2	46,4	48,3	49,9
FARO	48,1	1.0	44,4	47,6	48,3	48,7	49,5
AAPL	47,2	1,0	44,1	46,7	47,4	48,0	48,9
AAPL	43,1	1,9	37,8	41,8	43,3	44,3	47,1

Bảng 4.16 Tỷ lệ hủy theo phần trăm tin nhắn

Đối với giao dịch trong ngày, việc hiểu rõ động lực niêm yết và hủy niêm yết là rất quan trọng, đặc biệt là xung quanh giá mua và giá bán. Bảng 4.17 xem xét các lệnh được niêm yết theo khoảng cách đến giá trung bình (*Khoảng cách đến giá trung bình', k) của AAPL vào ngày 30 tháng 7 năm 2013 và để minh họa nội dung của bảng, chúng tôi sử dụng Hình 4.13. Cột thứ hai (°Số lệnh') đếm số lượng tin nhắn được niêm yết cách giá trung bình $k$ tick (cent). Trong Hình 4.13, chúng tôi hiển thị trực quan giá niêm yết giả định là $101,05 và chia đều số lượng giữa giá mua và giá bán. Ví dụ, tổng số lượng niêm yết cách giá trung bình hai tick (3.053 đơn vị) được hiển thị là 1.527 đơn vị niêm yết ở mức $101,07 và 1.527 đơn vị niêm yết ở mức $101,03 (tổng chiều dài của các thanh). Cột thứ ba ( $\because6%$ Exe') xem xét tỷ lệ phần trăm các lệnh đã đăng được thực hiện, nghĩa là lệnh đã đăng được khớp với lệnh MO đến. Trong Hình 4.13, điều này được minh họa bằng cách sử dụng màu sáng hơn cho các lệnh đã được thực hiện (và màu tối hơn cho các lệnh đã hủy). Ví dụ, trong số 1.527 đơn vị được đăng ở mức $101,07, 64,7 phần trăm (988 đơn vị) đã được thực hiện. Cuối cùng, cột thứ tư (Exe') mô tả tỷ lệ phần trăm của tổng số lệnh đã được thực hiện ở mức đó. Vì vậy, 988 lệnh được thực hiện ở mức $101,07 cộng với 988 lệnh được thực hiện ở mức $101,03, chiếm 9,2% tổng số lệnh được thực hiện trong ngày hôm đó. Nếu chúng ta xem xét mức chênh lệch giá (trung bình thời gian một phút) được báo giá cho ngày hôm đó

là 10,3 cent trung bình (Q1: 8,5, trung vị: 10,2, Q3: 11,7), phần lớn thời gian, khoảng cách đến giá trung bình (một nửa chênh lệch giá được niêm yết) là từ 4 đến 6 cent. Sử dụng thông tin trong Bảng 4.17, chúng tôi tính toán rằng 26%$ lệnh được thực hiện ban đầu được đặt ở mức từ 1 đến 3 cent so với giá trung bình, nhưng chỉ có 32%$ lệnh được đặt ở mức từ 4 đến 6 cent, và 42%$ lệnh còn lại được đặt ở mức tương đối xa so với giá trung bình (cách hơn 7 cent).

Mặt khác, nếu chúng ta nhìn vào khoảng cách từ mức giá trung bình tại thời điểm đó

7

Bảng 4.17 Tin nhắn theo khoảng cách đến giá trung bình tại thời điểm gửi và khi thoát (AAPL 2013-07-30).

Hình 4.13 Minh họa các lệnh được đăng và thực hiện như mô tả trong Bảng 4.17.

Giao dịch được thực hiện, không phải được ghi sổ, trong Bảng 4.17, chúng ta thấy rằng khoảng cách đến giá trung bình (tự nhiên) ngắn hơn và chúng ta có thể tính toán rằng 36% lệnh được thực hiện ở mức giá từ 1 đến 3 xu so với giá trung bình và 42% lệnh ở mức giá từ 4 đến 6, do đó chỉ có 22% lệnh thực hiện tương đối xa giá trung bình (cách xa hơn 7 xu). Điều này minh họa cho quan điểm đã nêu trước đó (khi so sánh độ biến động của chênh lệch giá hiệu dụng và chênh lệch giá niêm yết) rằng việc thực hiện có xu hướng xảy ra thường xuyên hơn khi chênh lệch giá hẹp hơn và do đó chênh lệch giá hiệu dụng đương nhiên sẽ ít biến động hơn chênh lệch giá niêm yết. Trong Hình 4.14, chúng tôi hiển thị hàm sống sót, $S(x)$ ， (một trừ CDF:

$S(x)=Pr(X>x)=1-F(x))$ của tổng số lệnh thực hiện, khi khoảng cách từ giá mà lệnh LO ban đầu được niêm yết tăng lên. Điều này thể hiện một giá trị xấp xỉ của 'xác suất khớp' - xác suất một lệnh niêm yết được thực hiện. Đường màu xanh đậm mô tả phân phối trong Bảng 4.17. Chúng tôi cũng đã bao gồm cùng một phân phối phân tách các lệnh thực hiện ở phía giá mua và giá bán, và điều thú vị là phân phối cho các lệnh thực hiện ở phía giá mua (giá bán) nằm thấp hơn (cao hơn) một cách có hệ thống so với phân phối cho tất cả các lệnh thực hiện. Điều này cho thấy các lệnh mua thị trường

Hình 4.14 Hàm sống sót cho các lần thực hiện như một hàm của khoảng cách từ giá trung bình.

có xu hướng diễn ra gần hơn nhiều với mức giá trung bình so với các lệnh bán trên thị trường vào ngày cụ thể này, ngày có luồng lệnh tổng thể tích cực đối với cổ phiếu AAPL và mức tăng giá nhẹ từ khi thị trường mở cửa đến khi thị trường đóng cửa.

Trong Hình 4.14, chúng tôi cũng đã bao gồm tổng số lệnh được phân tách theo thời gian trong ngày: nửa giờ đầu tiên sau khi thị trường mở cửa (Mkt Start), nửa giờ cuối cùng trước khi thị trường đóng cửa (Mkt Close) và khoảng thời gian giữa hai giờ (Intraday). Chúng tôi nhận thấy rằng Mkt Close có xu hướng thấp hơn Intraday, ngụ ý rằng trong nửa giờ cuối cùng của giao dịch, các lệnh có xu hướng gần với giá trung bình, điều này phù hợp với mô hình chênh lệch giá được báo giá trong Hình 4.6. Tuy nhiên, sự khác biệt này dường như không quá lớn và có thể không đáng kể về mặt thống kê.

Những gì diễn ra khi thị trường mở cửa trông rất khác biệt, vì phân phối cao hơn và khá xa so với Intraday. Có vẻ như chênh lệch giá rộng hơn mà chúng ta quan sát được trong Hình 4.6 và sự không chắc chắn từ Hình 4.7 kết hợp lại tạo ra các lệnh được khớp lệnh khá xa so với giá trung bình.

Hình 4.15 xem xét cùng dữ liệu từ một góc độ khác. Trong đó, chúng tôi xem xét (theo logarit) tỷ lệ các lệnh được đặt ở một khoảng cách nhất định so với giá trung bình cuối cùng được thực hiện. Giải thích tỷ lệ này như một xác suất, hình này hiển thị mối quan hệ giảm dần tự nhiên giữa khoảng cách từ giá trung bình và xác suất lệnh được thực hiện. Chúng tôi đã vẽ các đường cong này cho: tất cả các lệnh được thực hiện, các lệnh mua và bán tích cực và các lệnh được thực hiện theo thời gian trong ngày: xung quanh thời điểm thị trường mở cửa, thời điểm thị trường đóng cửa và thời gian còn lại trong ngày. Tất cả đều rất giống nhau, chỉ ngoại trừ một điểm: đó là trong nửa giờ đầu tiên của ngày giao dịch (Mkt Start). Điều chúng tôi quan sát được (khi xem xét dữ liệu cơ bản) là, tại Mkt Start, một tỷ lệ cao bất thường các giao dịch được đặt ở mức sáu xu so với giá trung bình sau đó được thực hiện và điều này tạo ra sự dịch chuyển trong CDF mà chúng tôi quan sát thấy trong Hình 4.15. Khi xem xét mức chênh lệch giá được trích dẫn trong thời gian đó, chúng tôi thấy rằng mức trung bình là 15,2 xu (Q1: 12,5, trung vị: 14,2, Q3: 19,0), điều này cho thấy khi sự không chắc chắn vào sáng sớm về ^giá thị trường thực' giảm đi, mức chênh lệch giá được trích dẫn phản ứng chậm và có một số lượng tương đối lớn các lệnh thực hiện và điều này xảy ra khi mức chênh lệch giá được trích dẫn đã giảm xuống khoảng 12 xu.

Hình 4.15 Nhật ký của tỷ lệ lệnh đã đăng được thực hiện theo khoảng cách từ giá trung bình.

4.5 Lệnh ẩn

Khi thảo luận về chất lượng thị trường trước đó (Phần 4.3), và đặc biệt là chênh lệch giá, chúng ta đã thấy rằng một trong những lý do khiến chênh lệch giá niêm yết thường lớn hơn chênh lệch giá thực tế là do sự hiện diện của các lệnh được niêm yết mà người tham gia thị trường không nhìn thấy, nhưng sẽ khớp với các lệnh MO sắp ra mắt trước các lệnh MO hiện có (ở mức giá bằng hoặc cao hơn giá mua/bán hiện tại). Đây là các lệnh ẩn.

Tài sản Trung bình Độ lệch chuẩn P01 Q1 Trung vị Q3 P99 ISNS 4 59 0 0 0 0 100 FARO 31 154 0 0 0 0 600 MENT * 117 568 0 0 0 0 2,150 AAPL 3.849 5.905 0 1.052 2.220 4.504 26.547 Tài sản Trung bình Độ lệch chuẩn P01 Q1 Trung vị Q3 P99 ISNS 1.2 10.7 0.0 0.0 0.0 0.0 99.6 FARO 9,9 27,1 0,0 0,0 0,0 0,0 100,0 MENT 9.4 24.1 0.0 0.0 0.0 0.0 100.0 AAPL 44,6 16,9 0,0 33,5 44,9 56,0 83,7

Bảng 4.18 Thực hiện lệnh ẩn (khối lượng $(Q)$ và phần trăm).

Bảng 4.18 được chia thành hai bảng. Bảng trên cùng của bảng mô tả số lượng được thực hiện theo lệnh ẩn trên NASDAQ mỗi phút, cho mỗi phút của năm 2013. Như chúng ta có thể thấy, đối với các tài sản ít được giao dịch hơn, ISNS, FARO và MENT, có rất ít giao dịch diễn ra theo lệnh ẩn (ít hơn 25% thời gian), mặc dù khi xảy ra thì nó có thể khá đáng kể. Nhưng đối với AAPL, trường hợp lại hoàn toàn khác. Chúng tôi thấy giao dịch theo lệnh ẩn chiếm hơn 75% thời gian và đối với một lượng cổ phiếu đáng kể (hơn 1.000 đơn vị mỗi phút). Lưu ý rằng những khối lượng lớn này không chỉ ra các giao dịch lớn, mà là các giao dịch khá thường xuyên: phân phối quy mô trung bình của một MO được thực hiện theo lệnh ẩn (mỗi phút) có giá trị trung bình là 127, với Q1 bằng 94 và Q3 bằng 148 cổ phiếu mỗi giao dịch. Bảng dưới cùng của Bảng 4.18 xem xét cùng một biến, số lượng

cổ phiếu được thực hiện theo lệnh ẩn, nhưng thay vì theo số lượng tuyệt đối, dưới dạng tỷ lệ phần trăm của tổng số cổ phiếu được thực hiện (trong phút đó). Đối với ISNS, FARO và MENT, việc thực hiện tương đối không thường xuyên và khi chúng xảy ra đối với lệnh ẩn, chúng có xu hướng là các giao dịch riêng lẻ. Trong những trường hợp đó, lệnh ẩn chiếm một tỷ lệ lớn, nếu không muốn nói là một trăm phần trăm, của tất cả các cổ phiếu được giao dịch trong phút đó. Đối với AAPL, việc thực hiện theo lệnh ẩn là một hiện tượng phổ biến và một nửa thời gian, chúng chiếm từ 33 đến 56 phần trăm của tất cả các giao dịch. Một đại lý đăng các ưu đãi hiển thị cho AAPL theo giá mua và giá bán (trong năm 2013) thấy rằng các ưu đãi của cô ấy thường bị các ưu đãi ẩn tích cực hơn lấn át.

4.6 Tài liệu tham khảo và bài đọc chọn lọc

Boehmer, Fong & Wu (2012), Chaboud, Hjalmarsson, Vega & Chiquoine (2009), Moallemi & Saglam (2013)SEC (2010)CFTC & SEC (2010),Hendershott, Jones & Menkveld (2011), Biais, Bisiere & Spatt (2010), Biais et al. (2005), Hagstromer & Norden (2013), Andersen & Bondarenko (2014), Pascual & Veredas (2009), Hirschey (2013), Martinez, Nieto, Rubio & Tapia (2005), Hasbrouck (2013), Hasbrouck & Saar (2013), Cartea & Meyer-Brandis (2010), Cartea (2013), Brogaard, Hendershott & Riordan (2014), Menkveld (2013), Riordan & Storkenmaier (2012), Hendershott & Riordan (2013), Foucault, Kadan & Kandel (2013), Moro, Vicente, Moyano, Gerig, Farmer, Vaglica, Lillo & Mantegna (2009), Gerig (2012), Hall & Hautsch (2007), Gould, Porter, Williams, McDonald, Fenn & Howison (2013)

Phần II

Công cụ toán học

$\text{1}$

Giới thiệu Phần II

Trong phần này của cuốn sách, chúng tôi phát triển các công cụ toán học để phân tích các thuật toán giao dịch: kiểm soát tối ưu ngẫu nhiên và dừng lỗ. Phần này được viết để giúp độc giả chưa từng tiếp xúc với các kỹ thuật này có thể trang bị cho mình những công cụ cần thiết để hiểu các mô hình toán học đằng sau một số chiến lược giao dịch thuật toán. Độc giả cần có kiến thức cơ bản về tài chính thời gian liên tục; tuy nhiên, cách tiếp cận ở đây mang tính thực dụng và chúng tôi không đi sâu vào các vấn đề toán học tinh tế. Thay vào đó, chúng tôi tập trung vào các cơ chế cho phép áp dụng ngay vào các bài toán giao dịch thuật toán được sử dụng ở tần suất thấp và cao. Để cung cấp cho độc giả cần ôn tập và để cuốn sách được trình bày một cách cô đọng, chúng tôi đưa vào Phụ lục A một bản tóm tắt ngắn gọn về các công cụ và kết quả chính của Giải tích Ngẫu nhiên cần thiết để nghiên cứu các bài toán kiểm soát và dừng lỗ ngẫu nhiên.

5 Kiểm soát tối ưu ngẫu nhiên và dừng lại

Giới thiệu

Các vấn đề kiểm soát ngẫu nhiên xuất hiện trong nhiều khía cạnh của mô hình tài chính. Ví dụ kinh điển là bài toán đầu tư tối ưu được Merton (1971) giới thiệu và giải quyết trong thời gian liên tục. Tất nhiên, còn rất nhiều ứng dụng khác, chẳng hạn như thiết lập cổ tức tối ưu, các bài toán tham gia và thoát lệnh tối ưu, định giá bàng quan tiện ích, v.v. Nhìn chung, mục tiêu bao trùm của các bài toán kiểm soát ngẫu nhiên là tối đa hóa (hoặc tối thiểu hóa) một hàm lợi nhuận (chi phí) kỳ vọng nào đó bằng cách điều chỉnh một chiến lược ảnh hưởng đến động lực của hệ thống ngẫu nhiên cơ bản, và tìm ra chiến lược đạt được giá trị cực đại (cực tiểu). Ví dụ, ở dạng đơn giản nhất của bài toán Merton, tác nhân đang cố gắng tối đa hóa tiện ích kỳ vọng của tài sản trong tương lai bằng cách giao dịch một tài sản rủi ro và một tài khoản ngân hàng không rủi ro. Hành động của tác nhân ảnh hưởng đến tài sản của cô ấy, nhưng đồng thời, động lực không chắc chắn của tài sản được giao dịch cũng điều chỉnh tài sản của tác nhân một cách ngẫu nhiên. Các chiến lược tối ưu thu được gắn liền với động lực của tài sản và có lẽ cả tài sản của tác nhân. Thật đáng ngạc nhiên là, trong nhiều trường hợp, các chiến lược tối ưu hóa ra lại là Markov trong các biến trạng thái cơ bản, ngay cả khi tác nhân đang xem xét các điều khiển phi Markov (điều này có thể phụ thuộc vào toàn bộ lịch sử của hệ thống). Một công cụ luôn được ưu tiên hàng đầu khi giải quyết các bài toán điều khiển ngẫu nhiên là

lems: nguyên lý quy hoạch động (DPP) và phương trình vi phân riêng phần phi tuyến tính (PDE) liên quan, được gọi là phương trình Hamilton-Jacobi-Bellman (HJB) - còn được gọi là phương trình quy hoạch động (DPE). DPP cho phép giải bài toán điều khiển ngẫu nhiên từ điểm cuối trở về trước, và phương trình HJB/DPE có thể được xem như phiên bản vô cùng nhỏ của nó.

Ở đây, các vấn đề toán học tinh tế không được đề cập đến mà thay vào đó tập trung vào các cơ chế cho phép ứng dụng trực tiếp vào các bài toán giao dịch thuật toán được sử dụng ở tần suất thấp và cao. Độc giả quan tâm có thể tham khảo nhiều tài liệu xuất sắc tập trung vào các khía cạnh lý thuyết của điều khiển ngẫu nhiên để hiểu sâu hơn về chủ đề này: Yong & Zhou (1999), Fleming & Soner (2006), Oksendal & Sulem (2007), Pham (2010) và Touzi (2013).

5.2 Ví dụ về các vấn đề kiểm soát trong tài chính

Phần này cung cấp một vài ví dụ về các bài toán kiểm soát ngẫu nhiên có động cơ tài chính. Ví dụ đầu tiên là một ví dụ kinh điển trong tài chính, liên quan đến việc đầu tư tối ưu trong dài hạn. Ví dụ thứ hai là một trong những bài toán kiểm soát giao dịch thuật toán đầu tiên, liên quan đến việc thanh lý tài sản tối ưu. Ví dụ thứ ba đề cập đến việc đặt lệnh tối ưu trong sổ lệnh giới hạn (LOB). Tất cả những ví dụ này về cơ bản chỉ là mô hình đồ chơi, và hai ví dụ cuối cùng sẽ là trọng tâm của nhiều chương sau.

Bài toán Merton 5.2.1

Ví dụ đầu tiên, hãy xem xét bài toán tối ưu hóa danh mục đầu tư cổ điển của Merton (1971), trong đó tác nhân tìm cách tối đa hóa giá trị tài sản kỳ vọng (đã chiết khấu) bằng cách giao dịch một tài sản rủi ro và một tài khoản ngân hàng phi rủi ro (xem Merton (1992) để biết thêm nhiều ví dụ và khái quát). Cụ thể, tại thời điểm $t$, tác nhân đặt $\pi t$ đô la trong tổng giá trị tài sản $X_{t}$ của mình vào tài sản rủi ro $S_{t}$ và tìm cách thu được cái gọi là hàm giá trị

$$H(S,x)=\sup_{\pi\in\mathcal{A}_{0,T}}\mathbb{E}_{S,x}\left[U\left(X_{T}^{\pi}\right)\right],$$

phụ thuộc vào giá trị tài sản hiện tại $2L$ và giá tài sản $S$, và chiến lược giao dịch tối ưu kết quả 71, trong đó,

(5.2a) $$\begin{aligned}dS_t&=(\mu-r):S_t:dt+\sigma:S_t:dW_t,&S_0=S,&\text{tài sản rủi ro,}\dX_t^\pi&=(\pi_t:(\mu-r)+r:X_t^\pi):dt+\pi_t:\sigma:dW_t,&X_0^\pi=x,&\text{tài sản của đại lý.}\end{aligned}$$

Trong phần trên, $\mu$ biểu thị tỷ lệ tăng trưởng kép liên tục (dự kiến) của tài sản giao dịch, $Y$ là tỷ lệ lợi nhuận kép liên tục của tài khoản ngân hàng không rủi ro,

。 $W=(W_{t}){{0\leq t\leq T}}$ là chuyển động Brown, 。 $S=(S{t}){{0\leq t\leq T}}$ là quá trình định giá chiết khấu của một tài sản được giao dịch, 。 $\pi=(\pi{t}){{0\leq t\leq T}}$ là chiến lược giao dịch tự tài trợ tương ứng với việc đầu tư $71t$ vào tài sản rủi ro tại thời điểm $t$ (với số tiền còn lại trong tài khoản ngân hàng không rủi ro) 。 $X^{\star}=(X{t}^{\star}){{0\leq t\leq T}}$ là quá trình tài sản chiết khấu của tác nhân với điều kiện là cô ấy tuân theo chiến lược tự tài trợ. 'IL 。 $U(x)$ là hàm tiện ích của tác nhân (ví dụ, lũy thừa $x^{T}$ , mũ $-e^{-\gamma\pi}$ và HARA $\frac{1}{\gamma}(x-x{0})^{\gamma}$, 。 ${\mathcal{A}}{t,T}$ là một tập hợp các chiến lược, được gọi là tập hợp có thể chấp nhận được, tương ứng với tất cả các chiến lược tự tài trợ có thể dự đoán được $\mathcal{F}$ có $\int{t}^{T}\pi_{s}^{2}:ds<+\infty.$ Ràng buộc này loại trừ các chiến lược nhân đôi và cho phép tồn tại các giải pháp mạnh của (5.2b).

Trong ví dụ kinh điển này, các quyết định giao dịch của tác nhân chỉ ảnh hưởng đến quá trình tích lũy tài sản của cô ấy, chứ không phải động lực của tài sản mà cô ấy đang giao dịch. Về mặt dài hạn, và nếu chiến lược của tác nhân không thay đổi "quá nhanh", thì đây là một giả định hợp lý. Tuy nhiên, nếu một tác nhân đang cố gắng mua (hoặc bán) một lượng lớn cổ phiếu trong một khoảng thời gian ngắn, hành động của cô ấy chắc chắn sẽ ảnh hưởng đến động lực của chính giá - bên cạnh quá trình tích lũy tài sản của cô ấy. Vấn đề này bị bỏ qua trong bài toán Merton, nhưng lại là trọng tâm của nghiên cứu về giao dịch thuật toán và cụ thể là các bài toán thực thi tối ưu mà chúng tôi sẽ giới thiệu tiếp theo.

5.2.2 Bài toán thanh lý tối ưu

Như đã đề cập ở trên, hãy tưởng tượng rằng một đại lý có một số lượng lớn cổ phiếu 97 của một tài sản có giá là $S_{t}.$ Hơn nữa, giả sử phân tích cơ bản của cô ấy về tài sản cho thấy rằng nó không còn là một khoản đầu tư có giá trị để nắm giữ. Do đó, cô ấy muốn thanh lý những cổ phiếu này vào cuối ngày, chẳng hạn như tại thời điểm $I$. Thực tế là thị trường không có thanh khoản vô hạn (để hấp thụ một lệnh bán lớn) ở mức giá tốt nhất hiện có ngụ ý rằng đại lý sẽ nhận được mức giá thấp nếu cô ấy cố gắng thanh lý tất cả các đơn vị ngay lập tức. Thay vào đó, cô ấy nên trải đều điều này theo thời gian và giải quyết một bài toán kiểm soát ngẫu nhiên để giải quyết vấn đề. Cô ấy cũng có thể có một cảm giác cấp bách nhất định để loại bỏ những cổ phiếu này, được thể hiện bằng cách phạt những hàng tồn kho khác không trong suốt chiến lược. Nếu $Wt$ biểu thị tốc độ mà đại lý bán cổ phiếu của mình tại thời điểm $t$ ， thì đại lý tìm kiếm hàm giá trị $$H(x,S,q)=\sup\limits_{\nu\in\mathcal{A}_{0,T}}\mathbb{E}\left[X_T^\nu+Q_T^\nu(S_T^\nu-\alpha Q_T^\nu)-\phi\int_0^T(Q_s^\nu)^2:ds\right]$$

và chiến lược giao dịch thanh lý tối ưu kết quả $v^{*}$ , trong đó,

dQ_t^Y = -\nu_t dt, Q_t^Y = q, S_t^Y = s_t(\nu_t) + \sigma dW_t, S_0^Y = S, dS_t^Y = S_t^Y - h(t)dt, S_0^Y = x, X_t^Y = X_0^Y + \int_0^t r_s ds + \int_0^t \xi_s dW_s, X_0^Y = x,

Ở trên

· $\nu=(\nu_{t}){{0\leq t\leq T}}$ là tỷ lệ (dương) mà tác nhân giao dịch (tỷ lệ thanh lý) và là tỷ lệ mà tác nhân có thể kiểm soát, 。 $Q^{\nu}=(Q{t}^{\nu}){{0\leq t\leq T}}$ là hàng tồn kho của tác nhân, 。 $W=(W{t}){{0\leq t\leq T}}$ là chuyển động Brown, 。 $S^{\nu}=(S{t}^{\nu}){{0\leq t\leq T}}$ là quá trình giá cơ bản, 。 $g:\mathbb{R}{+}\to\mathbb{R}{+}$ biểu thị tác động lâu dài (tiêu cực) mà hành động giao dịch của tác nhân có đối với giá cơ bản, 。 $\hat{S}^{\nu}=(S{t}^{\nu})_{{0\leq t\leq T}}$ tương ứng với quá trình giá thực hiện mà tại đó tác nhân có thể bán tài sản,

。 $h:\mathbb{R}{+}\to\mathbb{R}{+}$ biểu thị tác động tạm thời (tiêu cực) mà hành động giao dịch của đại lý gây ra đối với mức giá mà họ có thể thực hiện giao dịch, · $X^{\nu}=(X_{t}^{\nu}){{0\leq t\leq T}}$ là quy trình tiền mặt của đại lý, · $\mathcal{A}{t,T}$ là tập hợp các chiến lược được chấp nhận: $JL$ - các chiến lược bị chặn không âm có thể dự đoán được. Ràng buộc này loại trừ việc mua lại cổ phiếu và giữ tỷ lệ thanh lý hữu hạn.

Trong bài toán thanh lý tối ưu ở trên, người đại diện được cho là sẽ đăng lệnh thị trường theo thời gian để thanh lý cổ phiếu của mình. Một chiến lược như vậy về mặt trực giác là không tối ưu vì cô ấy sẽ liên tục vượt qua mức chênh lệch và có khả năng đi bộ trên sổ lệnh để bán cổ phiếu của mình. Vì cô ấy cũng có thể đặt lệnh giới hạn, nên ít nhất cô ấy có thể tiết kiệm chi phí vượt qua mức chênh lệch và thậm chí có thể đạt được hiệu suất tốt hơn bằng cách đăng sâu hơn trong sổ lệnh giới hạn LOB - ở độ sâu $\delta_{t}$ so với giá trung bình $S_{t}.$ Rủi ro khi làm như vậy là cô ấy có thể không thực hiện cổ phiếu của mình. Với điều kiện là lệnh bán thị trường đến, xác suất nâng lệnh bán đã đăng của người đại diện ở mức giá $S_{t}+\partial_{t}$ có thể được mô hình hóa như một hàm của $\delta_{t}$ mà chúng ta gọi là xác suất lấp đầy và ký hiệu là $P(\delta_{t})$. Do đó, đại lý có thể đặt ra bài toán kiểm soát để quyết định mức độ cô ấy phải đăng ký vào LOB để tối ưu hóa giá trị thanh lý cổ phiếu của mình, với điều kiện là phải vượt qua mức chênh lệch giá vào cuối kỳ hạn giao dịch. Trong trường hợp này, hàm giá trị của đại lý được cho bởi

$$H(x,S,q)=\sup\limits_{\delta\in\mathcal{A}_{[0,T]}}\mathbb{E}\left[X_T^\delta+Q_T^\delta\left(S_T^\delta-\alpha:Q_T^\delta\right)-\phi\int_0^T\left(Q_s^\delta\right)^2:ds\right]:,$$

Ở đâu

(5.5a) (5.5b) $$\begin{aligned}&M_{t}&&\text{lệnh bán thị trường,}\&S_{t}=S_{0}+\sigma:W_{t}:,&&\text{giá trung bình của tài sản,}\&dX_{t}^{\delta}=(S_{t}+\delta_{t}):(-dQ_{t}^{\delta}):,&&X_{0}^{\delta}=x:,&&\text{tiền mặt của đại lý,}\&dQ_{t}^{\delta}=-\mathbb{1}{\left{U{M_{t}^{-1}+1}>P(\delta_{t})\right}}:dM_{t}:,&&Q_{0}^{\delta}=q:,&&\text{tiền mặt của đại lý hàng tồn kho.}\end{aligned}$$ (5.5c) (5.5d)

và trong đó $U_{1},U_{2},\ldots$ là ii.d. các biến ngẫu nhiên đồng đều.

Kiểm soát quá trình khuếch tán

Trong phần này, các vấn đề kiểm soát có dạng tổng quát

$$H(\boldsymbol{x})=\sup\limits_{\boldsymbol{u}\in\mathcal{A}_{0,T}}\mathbb{E}\left[G(\boldsymbol{X}_{T}^{\boldsymbol{u}})+\int_{0}^{T}:F(s,\boldsymbol{X}_{s}^{\boldsymbol{u}},\boldsymbol{u}_{s}):ds\right]:,$$

trong đó $u:=:(\boldsymbol{u}t){0\leq t\leq T}$ là quá trình điều khiển có giá trị vectơ (dim p), $X^{u}=$ $(X_{t})_{0\leq t\leq T}$ là quá trình điều khiển có giá trị vectơ (dim 72 ) được cho là (trong phần này) là một quá trình điều khiển khuếch tán Ito thỏa mãn

$$d\boldsymbol{X}_t^u=\boldsymbol{\mu}(t,\boldsymbol{X}_t^u,\boldsymbol{u}_t):dt+\boldsymbol{\sigma}(t,X_t^u,\boldsymbol{u}_t):dW_t,\quad X_0^u=\boldsymbol{x}:,$$

trong đó $(W_{t}){0\leq t\leq T}$ là một vectơ chuyển động Brown độc lập, $A$ là một tập hợp (được gọi là tập hợp có thể chấp nhận) của $J$ -các quá trình có thể dự đoán sao cho (5.7) chấp nhận một nghiệm mạnh (và có thể chứa các ràng buộc khác như quá trình bị chặn), $G:\mathbb{R}^{72}\mapsto\mathbb{R}$ là phần thưởng cuối cùng và $F:\mathbb{R}+\times\mathbb{R}^{n+p}\mapsto\mathbb{R}$ là phần thưởng/hình phạt đang chạy. Nhìn chung, phần thưởng/hình phạt đang chạy có thể phụ thuộc vào thời gian t, vị trí hiện tại của quá trình được điều khiển $X_{t}^{u}$ và bản thân quá trình điều khiển $u_{t}$ trong khi phần thưởng cuối cùng chỉ phụ thuộc vào giá trị cuối cùng của quá trình được điều khiển. Để đơn giản, các hàm $G$ và $F$ được giả định là bị chặn đều và vectơ của độ trôi $\mu_{t}$ và độ biến động $\sigma t$, như thường lệ, là liên tục Lipschitz. Giả định khả tích trên các điều khiển, độ trôi và độ biến động là cần thiết để đảm bảo các bước được trình bày dưới đây có thể được thực hiện một cách chặt chẽ. Giả định khả năng dự đoán trên các điều khiển là cần thiết vì nếu không, tác nhân có thể nhìn vào tương lai để tối ưu hóa chiến lược của mình, và các chiến lược nhìn vào tương lai không thể được triển khai trong thế giới thực. Hàm giá trị (5.6) được diễn giải rằng tác nhân muốn

Tối đa hóa tổng hàm phần thưởng cuối cùng $G$ và phần thưởng/hình phạt đang chạy bằng cách hành động theo cách tối ưu. Hành động $2i$ của cô ấy ảnh hưởng đến động lực của hệ thống cơ sở theo một cách tổng quát nào đó được cho bởi (5.7). Do đó, hành động trong quá khứ của cô ấy ảnh hưởng đến động lực trong tương lai và do đó cô ấy phải điều chỉnh và tinh chỉnh hành động của mình để tính đến hiệu ứng phản hồi này.

Đối với một điều khiển tùy ý có thể chấp nhận được $U.$, hãy xác định cái gọi là tiêu chí hiệu suất $H^{u}(\boldsymbol{x})$ theo

$$H^u(x)=\mathbb{E}\left[G\left(X_T^u\right)+\int_0^TF(s,X_s^u,u_s):ds\right]:.$$

Do đó, tác nhân tìm cách tối đa hóa tiêu chí hiệu suất này và tự nhiên

$$H(\boldsymbol{x})=\sup_{u\in\mathcal{A}_{0,T}}H^{\boldsymbol{u}}(\boldsymbol{x}):.$$

Như đã đề cập trong phần giới thiệu, thay vì tối ưu hóa trực tiếp $H^{\boldsymbol{u}}(\boldsymbol{x})$, việc giới thiệu một tập hợp các bài toán tối ưu hóa được lập chỉ mục theo thời gian, trên đó có thể suy ra nguyên lý quy hoạch động (DPP) sẽ thuận tiện hơn (và mạnh mẽ hơn). DPP ở dạng vô cùng nhỏ dẫn đến một DPE, tức là phương trình Hamilton-Jacobi Bellman (HJB) - một phương trình đạo hàm riêng phi tuyến tính có nghiệm là nghiệm tạm thời của bài toán ban đầu. Nếu tồn tại một nghiệm cổ điển của DPE, có thể chứng minh, thông qua một đối số kiểm chứng, rằng nó thực sự là nghiệm của điều khiển ban đầu. Ba phần tiếp theo sẽ đề cập đến chương trình này.

Hình 5.1 DPP cho phép viết hàm giá trị dưới dạng kỳ vọng của hàm giá trị tương lai. Ý tưởng chính là chuyển động của quá trình được kiểm soát từ t đến $T$, sau đó viết lại kỳ vọng còn lại dưới dạng tiêu chí hiệu suất tương lai.

Nguyên lý lập trình động

Mẹo thông thường² để giải các bài toán điều khiển ngẫu nhiên (và xác định!) là nhúng bài toán ban đầu vào một lớp bài toán lớn hơn được lập chỉ mục theo thời gian $t\in[0,T]$ nhưng bằng với bài toán ban đầu tại $t=0$. Để làm được điều này, trước tiên hãy định nghĩa (với một chút lạm dụng ký hiệu)

$$\begin{đã căn chỉnh} &H(t,x) :=\sup_{u\in\mathcal{A}_{t,T}}H^{u}(t,\boldsymbol{x}):,\quad\mathrm{và} \\ &H^u(t,\boldsymbol{x}) :=\mathbb{E}_{t,\boldsymbol{x}}\left[:G(\boldsymbol{X}_{T}^{u})+\int_{t}^{T}:F(s,\boldsymbol{X}_{s}^{\boldsymbol{u}},\boldsymbol{u}_{s}):ds:\right]:, \end{đã căn chỉnh}$$

trong đó ký hiệu $\mathbb{E}{t,\boldsymbol{x}}\left[\cdot\right]$ biểu diễn kỳ vọng có điều kiện trên $X{t}^{u}=x$. Hai đối tượng này là mô hình tương tự theo chỉ số thời gian của bài toán điều khiển gốc và tiêu chí hiệu suất. Cụ thể, $H(0,\boldsymbol{x})$ trùng với bài toán điều khiển gốc (5.6) và $H^{\boldsymbol{u}}(0,\boldsymbol{x})$ trùng với tiêu chí hiệu suất (5.8).

Tiếp theo, hãy lấy một chiến lược chấp nhận được tùy ý $u$ và tưởng tượng việc đưa quá trình $X$ tiến về phía trước theo thời gian từ $t$ đến một thời điểm dừng tùy ý $\tau\leq T$. Khi đó, tùy thuộc vào $X_{\tau}^{u}$, đóng góp của phần thưởng/hình phạt đang diễn ra từ T đến 1 và phần thưởng cuối cùng có thể được xem là tiêu chí hiệu suất bắt đầu từ giá trị mới của $X_{\tau}^{u}$ (xem Hình 5.1). Điều này cho phép hàm giá trị được viết dưới dạng kỳ vọng về giá trị tương lai của nó tại T cộng với phần thưởng từ thời điểm hiện tại đến 'l

Chính xác hơn, bằng cách lặp lại các kỳ vọng, tiêu chí hiệu suất được lập chỉ mục theo thời gian

trở thành

$$\begin{đã căn chỉnh} H^{u}(t,x)& =\mathbb{E}_{t,x}\left[:G(\boldsymbol{X}_{T}^{\boldsymbol{u}})+\int_{\tau}^{T}:F(s,\boldsymbol{X}_{s}^{\boldsymbol{u}},\boldsymbol{u}_{s}):ds+\int_{t}^{\tau}:F(s,\boldsymbol{X}_{s}^{\boldsymbol{u}},\boldsymbol{u}_{s}):ds:\right] \\ &=\mathbb{E}_{t,x}\left[\mathbb{E}_{\tau,X_{\tau}^{u}}\left[G(X_{T}^{u})+\int_{\tau}^{T}F(s,X_{s}^{u},u_{s}):ds\right]+\int_{t}^{\tau}F(s,X_{s}^{u},u_{s}):ds\right] \\ &=\mathrm{E}_{t,x}\left[H^{u}(\tau,X_{\tau}^{u})+\int_{t}^{\tau}F(s,X_{s}^{u},u_{s}):ds\right].& (5.11) \end{đã căn chỉnh}$$

Bây giờ, $H(t,x)\geq H^{\boldsymbol{u}}(t,x)$ đối với một điều khiển chấp nhận được tùy ý $u$ (với đẳng thức được giữ nguyên nếu $u$ là điều khiển tối ưu $u^{*}$ - giả sử rằng $u^{\ast}\in\mathcal{A}{t,T}$ , tức là cực đại đạt được bằng một chiến lược chấp nhận được?) và một $3L$ tùy ý. Do đó, ở vế phải của (5.11), tiêu chí hiệu suất $H^{\boldsymbol{u}}(\tau,X{\tau}^{\boldsymbol{u}})$ tại thời điểm dừng 7 bị giới hạn ở trên bởi hàm giá trị $H(\tau,X_{\tau}^{u})$ Sau đó, đẳng thức có thể được thay thế bằng một bất đẳng thức với hàm giá trị (và không phải tiêu chí hiệu suất) xuất hiện bên dưới kỳ vọng:

$$\begin{đã căn chỉnh} H^{u}(t,x)& \leq\mathbb{E}_{t,\boldsymbol{x}}\left[:H(\tau,X_{\tau}^{u})+\int_{t}^{\tau}F(s,\boldsymbol{X}_{s}^{\boldsymbol{u}},\boldsymbol{u}_{s}):ds\right] \\ &\leq:\sup_{u\in\mathcal{A}}\mathbb{E}_{t,x}\left[:H(\tau,\boldsymbol{X}_{\tau}^{\boldsymbol{u}})+\int_{t}^{\tau}:F(s,\boldsymbol{X}_{s}^{\boldsymbol{u}},\boldsymbol{u}_{s}):ds\right]:. \end{đã căn chỉnh}$$

Lưu ý rằng ở phía bên phải của phần trên, điều khiển tùy ý $u$ chỉ hoạt động trong khoảng $[t,\tau]$ và điều khiển tối ưu được kết hợp ngầm định trong hàm giá trị $H(\tau,X_{\tau}^{\boldsymbol{u}})$ nhưng bắt đầu tại điểm mà điều khiển tùy ý $u$ khiến quá trình $X$ chảy tới, cụ thể là $X_{\tau}^{u}$

Lấy giá trị tối đa trên các chiến lược có thể chấp nhận được ở vế trái, do đó vế trái cũng được giảm xuống thành hàm giá trị, chúng ta có

$$\overline{H(t,\boldsymbol{x})\leq\sup_{\boldsymbol{u}\in\mathcal{A}}\mathbb{E}_{t,\boldsymbol{x}}\left[:H(\tau,\boldsymbol{X}_{\tau}^{\boldsymbol{u}})+\int_{t}^{\tau}F(s,\boldsymbol{X}_{s}^{\boldsymbol{u}},\boldsymbol{u}_{s}):ds\right]:.}$$

Điều này cung cấp cho chúng ta một bất đẳng thức đầu tiên

Tiếp theo, chúng ta muốn chứng minh rằng bất đẳng thức trên có thể đảo ngược được. Lấy một điều khiển chấp nhận được tùy ý $u\in\mathcal{A}$ và xét cái được gọi là điều khiển tối ưu E, ký hiệu là $v^{\varepsilon}\in\mathcal{A}$ và được định nghĩa là một điều khiển tốt hơn $H(t,x)-\varepsilon$ nhưng tất nhiên không tốt bằng $H(t,x)$, tức là một điều khiển sao cho

$$H(t,\boldsymbol{x})\geq H^{\boldsymbol{\upsilon}^{\boldsymbol{\epsilon}}}(t,\boldsymbol{x})\geq H(t,\boldsymbol{x})-\varepsilon:.$$

Một điều khiển như vậy tồn tại, giả sử rằng hàm giá trị là liên tục trong không gian của các điều khiển. Tiếp theo hãy xem xét sự sửa đổi của điều khiển tối ưu E

$$\tilde{v}^\varepsilon=u_t\mathbb{1__{t\leq\tau}+v^\varepsilon\mathbb{1__{t>\tau}:,$$

3 Có thể trường hợp mà giá trị tối đa đạt được bằng một chuỗi giới hạn các chiến lược có thể chấp nhận được mà trên thực tế chiến lược giới hạn đó không thể chấp nhận được

tức là sự sửa đổi là E-tối ưu sau thời gian dừng T nhưng có khả năng không tối ưu trên khoảng $\left[t,\tau\right]$. Sau đó, chúng ta có

$$\begin{đã căn chỉnh} &H(t,x) \geq H^{\tilde{v}^{\epsilon}}(t,\boldsymbol{x}) \\ &=\mathbb{E}_{t,x}\left[:H^{\tilde{v}^{e}}(\tau,X_{\tau}^{\tilde{v}^{e}})+\int_{t}^{\tau}:F(s,X_{s}^{\tilde{v}^{e}},\bar{v}^{e}{}_{s}):ds\right]:,& \left(\mathrm{from}:(5.11)\right), \\ &=\mathbb{E}_{t,x}\left[H^{\tilde{v}}(\tau,X_{\tau}^{u})+\int_{t}^{\tau}F(s,X_{s}^{u},u_{s}):ds\right]:,& \left(\mathrm{using~}\left(5.14\right)\right), \\ &\geq\mathbb{E}_{t,x}\left[:H(\tau,X_{\tau}^{u})+\int_{t}^{\tau}F(s,X_{s}^{u},u_{s}):ds\right]-\varepsilon:,& \left(\mathrm{by}:\left(5.13\right)\right). \\ &\Văn bản 1} \end{đã căn chỉnh}$$

Lấy giới hạn là $\varepsilon\searrow0$, ta có

$$H(t,\boldsymbol{x})\geq\mathbb{E}_{t,\boldsymbol{x}}\left[:H(\tau,\boldsymbol{X}_{\tau}^{u})+\int_{t}^{\tau}:F(s,\boldsymbol{X}_{s}^{\boldsymbol{u}},\boldsymbol{u}_{s}):ds\right]:.$$

Hơn nữa, vì điều trên đúng với mọi $u\in\mathcal{A}$ nên chúng ta có

$$\overline{H(t,\boldsymbol{x})\geq\sup_{\boldsymbol{u}\in\mathcal{A}}\mathbb{E}_{t,\boldsymbol{x}}\left[:H(\tau,\boldsymbol{X}_{\tau}^{\boldsymbol{u}})+\int_{t}^{\tau}F(s,\boldsymbol{X}_{s}^{\boldsymbol{u}},\boldsymbol{u}_{s}):ds\right]:.}$$

Giới hạn trên (5.12) và giới hạn dưới (5.15) tạo thành bất đẳng thức lập trình động. Kết hợp chúng lại, ta thu được định lý dưới đây.

ĐỊNH LÝ 5.1 Nguyên lý quy hoạch động cho khuếch tán. Hàm giá trị (5.10) thỏa mãn DPP

$$\overline{H(t,x)=\sup_{u\in\mathcal{A}}\mathbb{E}_{t,x}\left[H(\tau,X_{\tau}^{u})+\int_{t}^{\tau}F(s,X_{s}^{u},u_{s}):ds\right]:,}$$

với mọi $(t,\boldsymbol{x})\in[0,T]\times\mathbf{R}^{n}$ và mọi thời điểm dừng $\tau\leq T$

Phương trình này thực chất là một chuỗi các phương trình liên kết hàm giá trị với giá trị kỳ vọng tương lai của nó, cộng với phần thưởng/hình phạt đang diễn ra. Vì đây là một chuỗi các phương trình, một phương trình thậm chí còn mạnh hơn có thể được tìm thấy bằng cách xem xét phiên bản vô cùng nhỏ của nó, được gọi là DPE.

Phương trình lập trình động / Phương trình Hamilton-Jacobi-Bellman

DPE là phiên bản vô cùng nhỏ của nguyên lý quy hoạch động (DPP) (5.16). Có hai ý tưởng chính liên quan:

(i) Đặt thời gian dừng 7 trong DPP là thời gian nhỏ nhất giữa (a) thời gian cần thiết để quá trình $X_{t}^{u}$ thoát khỏi quả bóng có kích thước t xung quanh điểm bắt đầu của nó và (b) thời gian cố định (nhỏ) $h$ -- tất cả trong khi vẫn giữ cho nó bị giới hạn bởi $I$ Điều này có thể được xem như trong Hình 5.2 và có thể được phát biểu chính xác như sau

$$\tau=T\wedge\inf\left{s>t:(st,:|X_{s}^{u}-\boldsymbol{x}|)\not\in[0,h)\times[0,\epsilon)\right}.$$

Lưu ý rằng khi h0 $h\searrow0$ $h\searrow0,\tau\searrow t$ $\tau\searrow\vdots$ , khi và rằng $\tau:=:t+h$ bất cứ khi nào $h$ là

Hình 5.2 DPE là phiên bản vô cùng nhỏ của DPP, trong đó thời gian dừng T là thời gian thoát đầu tiên khỏi một quả bóng cỡ E hoặc thời gian dừng h nhỏ, tùy theo điều kiện nào xảy ra trước. Biểu đồ mẫu này gồm ba đường đi, và giá trị tương ứng $X_T^u$ và thời gian dừng $\tau$ được biểu thị bằng các vòng tròn đen với $\epsilon=0,05$ và $h=0,01$

đủ nhỏ - vì khi khoảng thời gian $h$ co lại, thì khả năng $X$ thoát khỏi quả bóng đầu tiên sẽ ngày càng thấp.

(ii) Viết hàm giá trị (cho một điều khiển tùy ý chấp nhận được $u$ ) tại thời điểm dừng T theo hàm giá trị tại $t$ bằng cách sử dụng định lý Ito. Cụ thể, giả sử hàm giá trị có đủ tính đều đặn, chúng ta có thể viết

$$\begin{đã căn chỉnh} &H(\tau,X_{\tau}^{u}) \\ &=H(t,x)+\int_{t}^{t}(\partial_{t}+\mathcal{L}_{s}^{u})H(s,\boldsymbol{X}_{s}^{u})ds+\int_{t}^{\tau}\mathcal{D}_{x}H(s,\boldsymbol{X}_{s}^{u})^{\prime}\boldsymbol{\sigma}_{s}^{u}dW_{s}, \end{đã căn chỉnh}$$

trong đó $\sigma_{t}^{u}:=\sigma(t,\boldsymbol{X}{t}^{u},u{t})$ đối với tính gọn nhẹ, $\mathcal{L}{t}^{\boldsymbol{u}}$ biểu diễn cho bộ tạo vô cùng nhỏ của $X{t}^{u}$ và ${\mathcal{D}}{x}H(\cdot)$ biểu thị vectơ của các đạo hàm riêng có thành phần $[\mathcal{D}{x}H(\cdot)]{i}:=:\partial{x^{i}}H(\cdot)$ . Ví dụ, trong trường hợp một chiều,

$$\begin{đã căn chỉnh} \mathcal{L}_{t}^{u}& =\mu_{t}^{u}:\partial_{x}+\frac{1}{2}(\sigma_{t}^{u})^{2}:\partial_{xx} \\ &=\mu(t,x,u):\partial_{x}+\frac{1}{2}\sigma^{2}(t,x,u):\partial_{xx}:. \end{đã căn chỉnh}$$

Như trước đây, chúng ta suy ra DPE theo hai bước bằng cách thu được hai bất đẳng thức. Đầu tiên, lấy $v\in\mathcal{A}$ không đổi trên khoảng $\left[t,\tau\right]$ ， áp dụng cận dưới (5.15) và thay (5.17) vào vế phải, ta suy ra rằng

$$\begin{đã căn chỉnh} H(t,x)& \geq\sup_{\boldsymbol{u}\in\mathcal{A}}\mathbb{E}_{t,\boldsymbol{x}}:\Sàn\llớn:H(\tau,\boldsymbol{X}_{\tau}^{\boldsymbol{u}})+\int_{t}^{\boldsymbol{r}}:F(s,\boldsymbol{X}_{s}^{\boldsymbol{u}},\boldsymbol{u}_{s}):ds\Sàn\rlớn \\ &\geq\mathbb{E}_{t,x}\left[:H(\tau,\boldsymbol{X}_{\tau}^{\boldsymbol{\upsilon}})+\int_{t}^{\boldsymbol{\tau}}:F(s,\boldsymbol{X}_{s}^{\boldsymbol{\upsilon}},\boldsymbol{\upsilon}):ds\right] \\ &=\mathbb{E}_{t,\boldsymbol{x}}:\bigg[:H(t,\boldsymbol{x}):+:\int_{t}^{r}(\partial_{t}+\mathcal{L}_{s}^{\boldsymbol{v}}):H(s,\boldsymbol{X}_{s}^{\boldsymbol{v}}):ds \\ &+\int_{t}^{\tau}\mathcal{D}_{x}H(s,X_{s}^{v})^{\prime}\boldsymbol{\sigma}_{s}^{\boldsymbol{\upsilon}}dW_{s}+\int_{t}^{\tau}F(s,\boldsymbol{X}_{s}^{\boldsymbol{\upsilon}},\boldsymbol{\upsilon}):ds\bigg]:. \end{đã căn chỉnh}$$

Tích phân trong tích phân ngẫu nhiên ở trên, tức là ${\mathcal D}{x}H(s,X{s}^{v})^{\prime}\sigma_{s}^{\upsilon}$ , bị chặn trên khoảng $\left|t,\tau\right|$ vì ta đã đảm bảo rằng $\left|X_{t}^{v}-x\right|\leq e$ trên khoảng đó. Do đó, tích phân ngẫu nhiên này là gia số của một martingale và ta có thể

đảm bảo rằng kỳ vọng của nó là bằng không. Do đó

$$H(t,x)\geq\mathbb{E}_{t,x}\left[:H(t,x):+\int_{t}^{\tau}\Big{:(\partial_{t}+\mathcal{L}_{s}^{v}):H(s,\boldsymbol{X}_{s}^{v})+F(s,\boldsymbol{X}_{s}^{v},\boldsymbol{\upsilon}):\Big}:ds\right]:,$$

và nhớ lại rằng $\tau=t+h$

Di chuyển $H(t,x)$ ở vế trái sang vế phải, chia cho $h$ và lấy giới hạn là $h\searrow0$ ta được

$$\begin{aligned}\text{0}&\geq\lim_{h\downarrow0}\mathbb{E}_{t,x}\left[\frac{1}{h}\int_{t}^{r}\left{:(\partial_{t}+\mathcal{L}_{s}^{v}):H(s,\boldsymbol{X}_{s}^{v})+F(s,\boldsymbol{X}_{s}^{v},\boldsymbol{\upsilon}):\right}ds\right]\&=\left(\partial_{t}+\mathcal{L}_{t}^{v}\right)H(t,x)+F(t,x,v):.\end{aligned}$$

Dòng thứ hai theo sau

(ii) điều kiện là $|X_{\tau}^{u}-x|\leq\epsilon$ , ngụ ý rằng nếu quá trình chạm đến rào cản thì nó bị giới hạn (ii) Định lý giá trị trung bình cho phép chúng ta viết $\operatorname*{lim}{h\downarrow0}\frac{1}{h{2}}\int_{t}^{t+h}\omega_{s}:ds=\omega_{t}$, và

(i) khi $h\searrow0$ ， $\tau=t+h$ vì quá trình sẽ không chạm tới rào cản của七trong khoảng thời gian cực kỳ ngắn, (iv) quá trình bắt đầu tại $X_{t}^{v}=x$

Vì bất đẳng thức trên giữ nguyên đối với $v\in\mathcal{A}$ tùy ý, nên ta suy ra rằng

$$\partial_tH(t,\boldsymbol{x})+\sup_{\boldsymbol{u}\in\mathcal{A}}\left(\mathcal{L}_t^\boldsymbol{u}H(t,\boldsymbol{x})+F(t,\boldsymbol{x},\boldsymbol{u})\right)\leq0:.$$

Tiếp theo, ta chứng minh bất đẳng thức thực sự là một đẳng thức. Để chứng minh điều này, giả sử $u^{*}$ là một điều khiển tối ưu, thì từ (5.16), ta có

$$H(t,x)=\mathbb{E}_{t,x}:\left[:H(\tau,\boldsymbol{X}_{\tau}^{\boldsymbol{u}^{_}})+\int_{t}^{\tau}:F(s,\boldsymbol{X}_{s}^{\boldsymbol{u}^{_}},\boldsymbol{u}^{*}):ds\right]:.$$

Như trên, bằng cách áp dụng định lý Ito để viết $H(\tau,X_{\tau}^u)$ theo $H(t,x)$ cộng với tích phân của các gia số của nó, lấy kỳ vọng và sau đó là giới hạn khi $h\searrow0$, ta thấy rằng

$$\partial_tH(t,x)+\mathcal{L}_t^{u^_}H(t,x)+F(t,x,u^_)=0:.$$

Kết hợp với (5.18), cuối cùng chúng ta đi đến DPE (còn được gọi trong bối cảnh này là phương trình HamiltonJacobiBellman

$$\boxed{\begin{array}{c}\partial_tH(t,\boldsymbol{x})+\sup\limits_{\boldsymbol{u}\in\mathcal{A}}\left(\mathcal{L}_t^\boldsymbol{u}H(t,\boldsymbol{x})+F(t,\boldsymbol{x},\boldsymbol{u})\right)=0:,\\H(T,\boldsymbol{x})=G(\boldsymbol{x}):.\end{array}}$$

Điều kiện đầu cuối ở trên tuân theo định nghĩa của hàm giá trị trong (5.10) từ đó chúng ta thấy rằng phần thưởng/hình phạt đang chạy giảm đi và $G(X_{T}^{u})$ là $F_{T}$ có thể đo lường được Lưu ý rằng việc tối ưu hóa điều khiển trong (5.19) chỉ trên giá trị của nó tại

thời gian $t$, thay vì trên toàn bộ đường đi của điều khiển. Do đó, có vẻ như điều khiển tối ưu có thể đạt được theo từng điểm. Xem xét hàm giá trị như

được biết, điều khiển tối ưu thường có thể được tìm thấy ở dạng điều khiển phản hồi theo hàm giá trị riêng của nó. Thay thế điều khiển phản hồi trở lại (5.19) dẫn đến PDE phi tuyến tính. Trên thực tế, hàm

$$\mathfrak{H}(t,:x,:\mathcal{D}_{x}H,:\mathcal{D}_{x}^{2}H)=\sup_{u\in\mathcal{A}}(\mathcal{L}_{t}^{u}H(t,x)+F(t,x,u))$$

được gọi là Hamiltonian của bài toán điều khiển ngẫu nhiên liên quan. Tại đây $\mathcal{D}{x}H$ và ${\mathcal D}{x}^{2}H$ biểu diễn tập hợp các đạo hàm bậc nhất và bậc hai của hàm giá trị $H$ tương ứng (hãy nhớ rằng nhìn chung $X$ có giá trị vectơ) và đặc biệt

$$[\mathcal{D}H]_k=\partial_{x^k}H:,\quad\mathrm{and}\quad[\mathcal{D__x^2H]_{jk}=\partial_{x^jx^k}H:.$$

Những vật thể này xuất hiện trong máy phát điện vô cùng nhỏ.

Ví dụ: Vấn đề Merton

Bây giờ hãy xem xét bài toán tối ưu hóa Merton được mô tả trong Phần 5.2.1. Bài toán tối ưu hóa được đưa ra trong (5.1) và có tiêu chí hiệu suất phụ thuộc thời gian liên quan

$$H^{\pi}(t,x,S)=\mathbb{E}_{t,x,S}\left[U\left(X_{T}^{\pi}\right)\right]:,$$

trong đó $X^{*}$ (tài sản của nhà đầu tư) và S (giá tài sản rủi ro) thỏa mãn SDE (5.2) với 71 biểu thị giá trị đô la của tài sản được đầu tư vào tài sản rủi ro S Từ (5.2b), bộ tạo vô cùng nhỏ của cặp quy trình $(X_{t}^{\pi},S_{t})_{0\leq t\leq T}$ khi đó là

$$\mathcal{L}{t}^{\pi}=(r:x+(\mu-r):\pi):\partial{x}+\frac{1}{2}\sigma^{2}:\pi:\partial_{xx}+(\mu-r):S:\partial_{S}+\frac{1}{2}\sigma^{2}:S^{2}:\partial_{SS}+\sigma:\pi:\partial_{xS}:.$$ Theo (5.19), hàm giá trị $H(t,x,S)=\operatorname*{sup}{\pi\in\mathcal{A}{[t,T]}}H^{\pi}(t,x,S)$ phải thỏa mãn phương trình

$$\begin{aligned}0&=\left(\partial_{t}+r:x:\partial_{x}+\frac{1}{2}:\sigma^{2}:S^{2}:\partial_{SS}\right)H\&+\sup_{\pi}\left{\pi:\left(\left(\mu-r\right)\partial_{x}+\sigma:\partial_{xS}\right)H+\frac{1}{2}\sigma^{2}:\pi^{2}:\partial_{xx}H\right}:,\end{aligned}$$

tuân theo điều kiện cuối cùng $H(T,x,S)=U(x)$ . Lưu ý rằng đối số của sup là bậc hai trong 74 và miễn là $\partial_{xx}H(t,x,S)<0$ , sup đạt giá trị cực đại. Bằng cách hoàn thành các bình phương, ta có

$$\pi:\left(\left(\mu-r\right)\partial_{x}+\sigma\partial_{x}s\right)H+\frac{1}{2}\sigma^{2}:\pi^{2}:\partial_{xx}H\=\frac{1}{2}:\sigma^{2}:\partial_{xx}H\left(\left(\pi-\pi^{_}\right)^{2}-\left(\pi^{_}\right)^{2}\right):,$$

Ở đâu

$$\boxed{\quad\pi^*=-\frac{(\mu-r):\partial_xH+\sigma:\partial_{xS}H}{\sigma^2:\partial_{xx}H}}$$

là điều khiển tối ưu dưới dạng phản hồi - nghĩa là nó là điều khiển tối ưu cho hàm giá trị $H(t,x,S)$ đã biết. Thay thế giá trị tối ưu này trở lại DPE

tạo ra PDE phi tuyến tính cho hàm giá trị

$$0=\begin{pmatrix}\partial_{t}+r:x:\partial_{x}+\frac{1}{2}:\sigma^{2}:S^{2}:\partial_{SS}\end{pmatrix}H-\frac{\begin{pmatrix}(\mu-r):\partial_{x}H+\sigma:\partial_{xS}H\end{pmatrix}^{2}}{2:\sigma^{2}:\partial_{xx}H}:.$$

Điều này đơn giản hóa phần nào khi quan sát rằng điều kiện cuối cùng $H(t,x,S)=$ $U(x)$ không phụ thuộc vào $S$. Do đó, nó gợi ý giải pháp $H(t,x,S)=h(t,x)$ trong trường hợp này chúng ta thu được một phương trình đơn giản hơn nhưng vẫn phi tuyến tính cho $h(t,x)$

$$0=(\partial_t+r:x:\partial_x):h(t,x)-\frac{\lambda}{2:\sigma}:\frac{(\partial_xh(t,x))^2}{\partial_{xx}h(t,x)}:,$$

với điều kiện đầu cuối $h(T,x)=U(x)$ và trong đó $\lambda=\frac{\mu-r}\sigma$ là giá thị trường của rủi ro, còn được gọi là tỷ lệ Sharpe. Hơn nữa, điều khiển tối ưu được đơn giản hóa thành

$$\pi^{*}=-\frac{\lambda}{\sigma}:\left(\frac{\partial_{x}h}{\partial_{xx}h}\right):.$$

Giải pháp rõ ràng của PDE phi tuyến tính phụ thuộc vào dạng chính xác của hàm tiện ích $U(x)$. Hai ví dụ kinh điển là

(i) tiện ích theo cấp số nhân

$$U(x)=-e^{-\gamma x}:,\quad\gamma>0:,$$

được xác định cho mọi $x\in\mathbb{R}$ và

(ii) tiện ích tránh rủi ro tuyệt đối hyperbolic (HARA)

$$U(x)=\frac{1-\gamma}{\gamma}\left(a+\frac{b}{1-\gamma}:x\right)^{\gamma}:,\quad\gamma>1:,:b>0:,:x\in\left(-(1-\gamma)\frac{a}{b},+\infty\right):.$$

Trong trường hợp này, mức tài sản được phép có giới hạn dưới và nhà đầu tư chắc chắn không muốn tài sản giảm xuống dưới mức này.

Đối với tiện ích theo cấp số nhân, hàm giá trị thừa nhận một giải pháp affine và chúng ta có thể viết một ansatz

$$h(t,x)=-\alpha(t):e^{-\gamma:x:\beta(t)}:,$$

trong đó $\alpha(t)$ và $\beta(t)$ vẫn chưa được xác định là các hàm riêng của thời gian. Từ điều kiện cuối cùng $h(T,X)=-e^{-\gamma:x}$, ta có $\alpha(T)=\beta(T)=1$ và khi thay trở lại PDE phi tuyến tính ở trên, ta thấy rằng

$$\begin{pmatrix}\partial_t\alpha-\frac{\lambda}{2\sigma}:\alpha\end{pmatrix}-\gamma:(\partial_t\beta+r:\beta):\alpha:x=0:.$$

Vì điều này phải đúng với mọi $JL$ và $t$, nên các số hạng trong ngoặc nhọn phải triệt tiêu nhau. Hai phương trình $\partial_{t}\alpha-\frac{\lambda}{2\sigma}:\alpha=0$ và $\partial_{t}\beta+r:\beta=0$, cùng với các điều kiện kết thúc, có thể dễ dàng giải được để tìm

$$\alpha(t)=e^{-\frac{\lambda}{2\sigma}(Tt)},\quad\beta(t)=e^{r(Tt)}:.$$

Khi thay thế ngược, chúng ta thấy rằng số tiền tối ưu để đầu tư vào tài sản rủi ro là một hàm xác định của thời gian

$$\pi^*(t)=\frac{\lambda}{\gamma:\sigma}:e^{-r(Tt)}:.$$

Khi mức độ ngại rủi ro tăng lên, nhà đầu tư sẽ đầu tư ít hơn vào tài sản rủi ro. Việc số tiền đầu tư không phụ thuộc vào tài sản là kết quả của mức độ ngại rủi ro tuyệt đối của tác nhân, được định nghĩa là $-U^{\prime\prime}(x)/U^{\prime}(x)=\gamma$, là một hằng số vì tác nhân sử dụng tiện ích theo hàm mũ. Ví dụ, đối với tiện ích HARA, cả mức độ ngại rủi ro tuyệt đối lẫn mức độ ngại rủi ro tương đối, được định nghĩa là $R(x)=-x:U^{\prime\prime}(x)/U^{\prime}(x)$, đều không phải là hằng số. Trong trường hợp HARA, khoản đầu tư rủi ro của tác nhân là một hàm số không tầm thường của cả tài sản và thời gian.

Xác minh

Việc suy ra DPE (5.19) trong phần trước cung cấp một điều kiện cần thiết cho hàm giá trị. Tuy nhiên, một câu hỏi quan trọng là liệu một nghiệm của DPE có thực sự cung cấp lời giải cho bài toán điều khiển ban đầu hay không. Công cụ chính để chứng minh điều này là đúng, khi tồn tại các lời giải cổ điển cho DPE liên quan, chính là cái gọi là định lý kiểm chứng. Chúng tôi trình bày kết quả bên dưới và giới thiệu cho độc giả nhiều tài liệu xuất sắc về điều khiển tối ưu để chứng minh, ví dụ: Yong & Zhou (1999), Fleming & Soner (2006), Oksendal & Sulem (2007), và Pham (2010).

ĐỊNH LÝ 5.2Định lý kiểm chứng.. $Cho:\psi\in{\mathcal C}^{1,2}([0,T]\times{\mathcal R}^{n})$ và thỏa mãn với mọi $u\in\mathcal{A}$

$$\partial_{t}\psi(t,\boldsymbol{x})+(\mathcal{L}_{t}^{\boldsymbol{u}}\psi(t,\boldsymbol{x})+F(t,\boldsymbol{x},\boldsymbol{u}))\leq0:,\quad\forall:(t,\boldsymbol{x})\in[0,T]\times\mathbb{R}^{n}:,\G(\boldsymbol{x})-\psi(T,x)\leq0:.$$

Sau đó

$$\psi(t,\boldsymbol{x})\geq H^{\boldsymbol{u}}(t,\boldsymbol{x}):,\quad\forall:(t,\boldsymbol{x})\in[0,T]\times\mathbf{R}^{n}:,$$

đối với tất cả các điều khiển Markov $u\in\mathcal{A}$

Hơn nữa, nếu với mọi $(t,\boldsymbol{x}):\in:[0,T]\times\mathbb{R}^{n}$ , thì tồn tại $u^*(t,\boldsymbol{x})$ có thể đo được sao cho

$$\begin{aligned}\text{0}&=:\partial_{t}\psi(t,\boldsymbol{x})+\left(\mathcal{L}_{t}^{\boldsymbol{u}^{_}(t,\boldsymbol{x})}\psi(t,\boldsymbol{x})+F(t,\boldsymbol{x},\boldsymbol{u}^{_}(t,\boldsymbol{x}))\right)\&=:\partial_{t}\ps i(t,\boldsymbol{x})+\sup_{\boldsymbol{u}\in\mathcal{A}}\left(\mathcal{L}_{t}^{\boldsymbol{u}}\psi(t,\boldsymbol{x})+F(t,\boldsymbol{x},\boldsymbol{u})\right),&\forall:(t,\boldsymbol{x})\in[0,T]\times\mathbb{R}^{n}:,\end{aligned}$$

với $\psi(T,\boldsymbol{x})=G(\boldsymbol{x})$ ， và SDE

$$d\boldsymbol{X}_{s}^{*}=\mu(t,\boldsymbol{X}_{s}^{_},\boldsymbol{u}^{_}(t,\boldsymbol{X}_{s}^{*})):dt+\boldsymbol{\sigma}(t,\boldsymbol{X}_{s}^{_},\boldsymbol{u}^{_}(t,\boldsymbol{X}_{s}^{*}))dW_{s},\quad X_{t}^{*}=x:,$$

thừa nhận α giải pháp duy nhất và ${u^{}(s,\boldsymbol{X}_{8}^{})}_{t\leq s\leq T}\in\mathcal{A}$, thì

$$H(t,\boldsymbol{x})=\psi(t,\boldsymbol{x}):,\quad\forall:(t,\boldsymbol{x})\in[0,T]\times\mathbb{R}^{n}:,$$

và $u^*$ là một điều khiển Markov tối ưu

Định lý phát biểu rằng nếu chúng ta có thể tìm ra một giải pháp cho DPE và chứng minh rằng đó là một giải pháp cổ điển, tức là có thể phân biệt một lần theo thời gian và có thể phân biệt hai lần theo các biến trạng thái, và điều khiển kết quả là chấp nhận được, thì

Giải pháp thực sự là hàm giá trị mà chúng ta tìm kiếm và điều khiển kết quả là điều khiển tối ưu, ít nhất là một điều khiển Markov tối ưu. Một kết quả quan trọng khác là, theo một số giả định kỹ thuật hơn, điều khiển tối ưu là Markov, ngay cả khi chúng ta tìm kiếm trên các điều khiển tổng quát có thể dự đoán được $F$. Xem, ví dụ, Định lý 11.2.3 trong Oksendal (2010).

Kiểm soát quá trình đếm

Trong phần trước, các quá trình khuếch tán là nguồn gốc gây ra sự bất định trong bài toán điều khiển. Trong nhiều trường hợp, và đặc biệt là các vấn đề liên quan đến giao dịch thuật toán và giao dịch tần suất cao, các quá trình đếm sẽ được sử dụng để tạo ra sự bất định. Có nhiều đặc điểm có thể được kết hợp vào phân tích, nhưng cách tiếp cận chung vẫn giữ nguyên, và do đó, chỉ trường hợp một quá trình đếm duy nhất với cường độ được kiểm soát sẽ được nghiên cứu. Điều này tương đương với việc xử lý các quá trình Poisson ngẫu nhiên kép, hay còn gọi là quá trình Cox, là các quá trình đếm với cường độ mà bản thân nó là một quá trình ngẫu nhiên và trong trường hợp này ít nhất được kiểm soát một phần. Hãy xem xét tình huống trong đó tác nhân có thể kiểm soát tần suất của

nhảy vào một quá trình đếm $N$ và làm như vậy để tối đa hóa một số mục tiêu. Trong trường hợp này, bài toán điều khiển có dạng tổng quát

$$H(n)=\sup\limits_{u\in\mathcal{A}_{0,T}}\mathbb{E}\left[G(N_T^u)+\int_0^TF(s,N_s^u,u_s):ds\right]:,$$

trong đó $u:=:(u_{t}){0\leq t\leq T}$ là quá trình điều khiển, $(N{t}^{u}){0\leq t\leq T}$ là quá trình Poisson ngẫu nhiên kép được điều khiển (bắt đầu từ $N{0-}:=: n$ ) với cường độ $\lambda_{t}^{u}=\lambda(t,:N_{t-}^{u},:u_{t})$ sao cho $(\tilde{N}{t}^{u}){0\leq t\leq T}$ , trong đó

$$\widehat N_t^u=N_t-\int_0^t\lambda_s^u:ds$$

là một martingale, $\mathcal{A}$ là một tập hợp $F$ tiến trình có thể dự đoán được sao cho $\hat{N}$ là một martingale thực sự, $G:\mathbb{R}\mapsto\mathbb{R}$ là một phần thưởng cuối cùng và $F:\mathbb{R}_+\times\mathbb{R}^2\mapsto\mathbb{R}$ là một phần thưởng/hình phạt liên tục. Như trước đây, các hàm $G$ và $F$ được giả định là bị chặn đều.

Đối với một điều khiển tùy ý có thể chấp nhận được 24, tiêu chí hiệu suất $H^{u}(n)$ được đưa ra bởi $$H^u(n)=\mathbb{E}\left[G\left(N_T^u\right)+\int_0^T:F(s,N_s^u):ds\right],$$

và tác nhân tìm cách tối đa hóa tiêu chí hiệu suất này, tức là

$$H(n)=\sup_{u\in A_{0,T}}H^u(n):.$$

Trong hai tiểu mục tiếp theo, chúng tôi cung cấp cách suy luận ngắn gọn về DPP và DPE liên quan.

5.4.1 Nguyên lý lập trình động

Như trước đây, vấn đề ban đầu được nhúng vào một lớp lớn hơn các vấn đề được lập chỉ mục theo thời gian $t\in[0,T]$ bằng cách đầu tiên xác định

$$\begin{đã căn chỉnh} &H(t,n) :=\sup_{u\in\mathcal{A}_{t,T}}H^{u}(t,n):,\quad\mathrm{và} \\ &H^u(t,n) :=\mathbb{E}_{t,n}\left[:G(N_{T}^{u})+\int_{t}^{T}:F(s,N_{s}^{u},u_{s}):ds:\right]:, \end{đã căn chỉnh}$$

trong đó ký hiệu $\mathbb{E}{t,n}[\cdot]$ biểu diễn kỳ vọng có điều kiện là $N{t^{-}}=n$ . Tiếp theo, lấy một chiến lược tùy ý có thể chấp nhận được $u$ và truyền tiến trình $N$ về phía trước theo thời gian từ $t$ đến thời điểm dừng tùy ý $\tau\leq T$ . Sau đó, có điều kiện là $N_{\tau}^{u}$ ， sự đóng góp của phần thưởng/hình phạt đang chạy từ $^{\prime}I$ đến 7 và phần thưởng cuối cùng có thể được xem như tiêu chí hiệu suất bắt đầu từ giá trị mới của $N_{\tau}^{n}$ Điều này cho phép hàm giá trị được viết theo kỳ vọng về giá trị tương lai của nó tại 7 cộng với phần thưởng giữa thời điểm hiện tại và 7 Chính xác hơn, bằng các kỳ vọng lặp lại, tiêu chí hiệu suất được lập chỉ mục theo thời gian

trở thành

$$\begin{đã căn chỉnh} H^{u}(t,n)& =\mathbb{E}_{t,n}\left\lfloor G(N_{T}^{u})+\int_{\tau}^{T}F(s,N_{s}^{u},u_{s}):ds+\int_{t}^{\tau}F(s,N_{s}^{u},u_{s}):ds\right\rfloor \\ &=\mathbb{E}_{t,n}\left[\mathbb{E}_{\tau,N_{\tau}^{u}}\left[G(N_{T}^{u})+\int_{\tau}^{T}F(s,N_{s}^{u},u_{s}):ds\right]+\int_{t}^{\tau}F(s,N_{s}^{u},u_{s}):ds\right] \\ &=\mathbb{E}_{t,n}\left[:H^{u}(\tau,N_{\tau}^{u})+\int_{t}^{\tau}F(s,N_{s}^{u},u_{s}):ds\right]. \end{đã căn chỉnh}$$

Bây giờ, $H(t,n):\geq:H^{u}(t,n)$ đối với một điều khiển tùy ý có thể chấp nhận được $2L$ (với sự bằng nhau được giữ nguyên nếu $U.$ là điều khiển tối ưu $u^{*}$ ) và một $7t$ tùy ý. Do đó, ở vế phải của (5.25), tiêu chí hiệu suất $H^{u}(\tau,N_{\tau}^{u})$ bị chặn trên bởi hàm giá trị $H(\tau,N_{\tau}^{u})$ và sự bằng nhau có thể được thay thế bằng một bất đẳng thức với hàm giá trị (và không phải là tiêu chí hiệu suất) xuất hiện dưới kỳ vọng:

$$\begin{đã căn chỉnh} H^{u}(t,n)& \leq:\mathbb{E}_{t,n}:\bigg\lfloor H(\tau,N_{\tau}^{u})+\int_{t}^{\tau}:F(s,N_{s}^{u},u_{s}):ds\bigg\rfloor \\ &\leq\sup_{u\in\mathcal{A}}\mathbb{E}_{t,n}\left[:H(\tau,N_{\tau}^{u})+\int_{t}^{\tau}:F(s,N_{s}^{u},u_{s}):ds\right]:. \end{đã căn chỉnh}$$

Lưu ý rằng ở phía bên phải của dòng đầu tiên của (5.26), điều khiển tùy ý u chỉ hoạt động trên khoảng $\left|t,\tau\right|$ và điều khiển tối ưu được kết hợp ngầm định trong hàm giá trị $H(\tau,N_{\tau}^{u})$ , nhưng với biến trạng thái $\Lambda^{\prime}$ bắt đầu tại điểm mà điều khiển tùy ý $u$ khiến $N$ chảy, cụ thể là $N_{\tau}^{u}$ . Tiếp theo, việc lấy điều khiển tốt nhất ở phía bên phải cũng phải chi phối phía bên trái vì điều khiển tùy ý thực sự chi phối. Khi đó, phía bên phải không còn phụ thuộc vào điều khiển tùy ý nữa. Cuối cùng, việc lấy một giá trị cực đại trên tất cả các điều khiển chấp nhận được ở phía bên trái cho phép chúng ta thay thế phía bên trái bằng hàm giá trị

và cung cấp cho chúng ta bất đẳng thức đầu tiên

$$H(t,n)\leq\sup\limits_{u\in\mathcal{A}}\mathbb{E}_{t,n}\left[:H(\tau,N_{\tau}^{u})+\int_{t}^{\tau}:F(s,N_{s}^{u},u_{s}):ds\right]:.$$

Để có được bất đẳng thức ngược lại, hãy lấy một điều khiển tối ưu $E$ được ký hiệu là $v^{t}\in\mathcal{A}$ sao cho

$$H(t,x)\geq H^{\upsilon^{\epsilon}}(t,x)\geq H(t,x)-\epsilon:.$$

Một điều khiển như vậy tồn tại nếu hàm giá trị liên tục trong không gian điều khiển. Hãy xem xét sự sửa đổi của nó cho đến thời điểm T.

$$\tilde{v}^\epsilon=u_t\mathbb{1__{t\leq\tau}+v^\epsilon\mathbb{1>\tau}:,$$

trong đó $u\in\mathcal{A}$ là một điều khiển chấp nhận được tùy ý. Khi đó, ta có

$$\begin{đã căn chỉnh} H(t,n)& \geq H^{\hat{v}^{*}}(t,n) \\ &=\mathbb{E}_{t,n}\left[:H^{\tilde{v}^{\epsilon}}(\tau,N_{\tau}^{\tilde{v}^{\epsilon}})+\int_{t}^{\tau}:F(s,N_{s}^{\tilde{v}^{\epsilon}},\bar{v}_{s}^{\epsilon}):ds\right]:,& \left(\mathrm{from}:(5.25)\right), \\ &=\mathbb{E}_{t,n}\left[:H^{\hat{v}^{e}}(\tau,N_{\tau}^{u})+\int_{t}^{\tau}:F(s,N_{s}^{u},u_{s}):ds\right]:,& \left(\mathrm{using~}\left(5.29\right)\right), \\ &\geq\mathbb{E}_{t,n}\left[:H(\tau,N_{\tau}^{u})+\int_{t}^{\tau}:F(s,N_{s}^{u},u_{s}):ds\right]-\varepsilon:,& (\mathrm{by}:(5.28)):. && \end{đã căn chỉnh}$$

Vì điều trên đúng với mọi $u.$ và mọi $E$, nên nó đúng với sup, và chúng ta lấy giới hạn là $\varepsilon\searrow0$ để tìm bất đẳng thức

$$H(t,n)\ge\sup\limits_{u\in\mathcal{A}}\mathbb{E}_{t,n}\left[:H(\tau,N_{\tau}^{u})+\int_{t}^{\tau}:F(s,N_{s}^{u},u_{s}):ds\right]:.$$

Kết hợp (5.30) với (5.27), ta thu được định lý dưới đây,

ĐỊNH LÝ 5.3 Nguyên lý lập trình động cho các quá trình đếm. Hàm giá trị (5.23) thỏa mãn DPP

$H(t,n)=\sup_{u\in\mathcal{A}}\mathbb{E}{t,n}\left[H(\tau,N^u\tau)+\int_t^\tau F(s,N^u_s;u_s),ds\right],$

với mọi $(t,n)\in[0,T]\times Z_{+}$ và mọi thời điểm dừng $T\leq I$

Phương trình lập trình động / Phương trình Hamilton-Jacobi-Bellman

Phần này phát triển DPE thỏa mãn hàm giá trị, mà chúng ta thu được bằng cách xem xét DPP trong khoảng thời gian vô cùng nhỏ. Tương tự như trường hợp khuếch tán, hãy đặt thời gian dừng T trong DPP là giá trị nhỏ nhất của (i) thời gian cần thiết để quá trình $N_{t}^{u}$ thoát khỏi một quả bóng có kích thước $t$ quanh điểm xuất phát của nó, và (ii) một thời gian $h$ cố định (nhỏ), đồng thời giữ cho nó bị giới hạn bởi $T$

$$\tau=T\wedge\inf{s>t:(st,:|N_{s}^{u}-n|)\không\trong[0,h)\lần[0,\epsilon)}:.$$

Tiếp theo, hãy viết hàm giá trị (cho một điều khiển tùy ý có thể chấp nhận được $2L$ ) tại thời điểm dừng 71 theo hàm giá trị tại $t$ bằng cách sử dụng định lý Ito. Cụ thể,

$$\begin{aligned}H(\tau,N_{\tau}^{u})&=:H(t,n)+\int_{t}^{\tau}(\partial_{t}+\mathcal{L}_{s}^{u})H(s,N_{s}^{u}):ds\&+\int_{t}^{\tau}\left[H(s,N_{s^{-}}^{u}+1)-H(s,N_{s^{-}}^{u})\right]:d\widehat{N}_{s}^{u}:,\end{aligned}$$

trong đó $\mathcal{L}{t}^{u}$ biểu diễn cho bộ tạo vô cùng nhỏ của $N{t}^{u}$ và tác động lên các hàm $h:\mathbb{R}{+}\times\mathbb{Z}{+}\mapsto\mathbb{R}$ như sau:

$$\mathcal{L}_{t}^{u}h(t,n)=\lambda(t,n,u)\left[h(t,n+1)-h(t,n)\right]:.$$

Lấy $v\in\mathcal{A}$ là hằng số trong khoảng $[t,\tau]$ , áp dụng giới hạn dưới (5.30) và thay (5.32) vào vế phải ngụ ý rằng

$$\begin{đã căn chỉnh} H(t,n)& \geq:\sup_{u\in\mathcal{A}}\mathbb{E}_{t,n}\left[:H(\tau,N_{\tau}^{u})+\int_{t}^{T}F(s,N_{s}^{u},u_{s}):ds\right] \\ &\geq\mathbb{E}_{t,n}\left[:H(\tau,N_{\tau}^{v})+\int_{t}^{\tau}F(s,N_{s}^{v},v):ds\right] \\ &=\mathbb{E}_{t,n}\left[:H(t,n):+\int_{t}^{\tau}\left(\partial_{t}+\mathcal{L}_{s}^{v}\right)H(s,N_{s}^{v}):ds\right] \\ &+\int_{t}^{r}\left(H(s,N_{s^{-}}^{v}+1)-H(s,N_{s^{-}}^{v})\right)d\widehat{N}_{s}^{v}+\int_{t}^{\tau}F(s,N_{s}^{v},v):ds \\ &=\mathbb{E}_{t,n}\left[:H(t,n):+\int_{t}^{\tau}\left((\partial_{t}+\mathcal{L}_{s}^{v}):H(s,N_{s}^{v})+F(s,N_{s}^{v},v)):ds\right]:.\right] \end{đã căn chỉnh}$$

Đẳng thức thứ ba được suy ra bởi vì tích phân ngẫu nhiên đối với $\tilde{N}{t}$ có giá trị trung bình bằng không vì $\tilde{N}{t}$ là một martingale. Tính chất martingale được đảm bảo bởi vì ta có $|N_{t}^{v}-n|\leq\epsilon$ ； và do đó ${\mathcal{L}}{t}^{\nu}H(t,N{t}^{\nu})$ bị chặn. Trừ $H(t,n)$ , chia cho $h$ , và lấy giới hạn là $h\searrow0$ ngụ ý rằng

$$\begin{aligned}&0\geq\operatorname*{lim}_{h\downarrow0}\mathbb{E}_{t,n}\left[\frac{1}{h}\int_{t}^{\tau}\left(\left(\partial_{t}+\mathcal{L}_{s}^{v}\right)H(s,N_{s}^{v})+F(s,N_{s}^{v},\upsilon):\right):ds\right]\&=\left(\partial_{t}+\mathcal{L}_{t}^{v}\right)H(t,n)+F(t,n,v):.\end{aligned}$$

Ở trên, điều khiển là hằng số và bằng $v$ trên khoảng $[t,\tau]$ Dòng thứ hai theo sau, như trước, từ:

(i) vì $h\searrow0$ ， $\tau=t+h$ vì quá trình sẽ không chạm tới rào cản E trong khoảng thời gian cực ngắn (ii) điều kiện là $\left|N_{\tau}^{v}-n\right|\leq e$ , do đó nếu quá trình chạm tới rào cản, nó bị chặn, (ii) Định lý cơ bản của phép tính: $\operatorname*{lim}{h\downarrow0}\frac{1}{h}\int{t}^{t+h}\omega_{s}:ds=\omega_{t}$ , và (iv) $N_{t^{-}}^{u}=n$

Vì bất đẳng thức trên giữ nguyên đối với $v\in\mathcal{A}$ tùy ý, nên ta suy ra rằng

$$\partial_{t}H(t,n)+\sup_{u\in\mathcal{A}}\left(\mathcal{L}_{t}^{u}H(t,n)+F(t,n,u)\right)\leq0:.$$

Tiếp theo, chúng ta chứng minh bất đẳng thức thực sự là một đẳng thức. Vì mục đích này, giả sử

rằng $u^{*}\in\mathcal{A}$ là một điều khiển tối ưu, thì từ DPP (5.31) chúng ta có

$$H(t,n)=\mathbb{E}_{t,n}\left[H(\tau,N_{\tau}^{u^_})+\int_{t}^{\tau}F(s,N_{s}^{u^_},u_{s}^*):ds\right]:.$$

Lặp lại các bước từ trên (tức là áp dụng định lý Ito, lấy kỳ vọng và giới hạn là $h\searrow0$), ta thấy rằng

$$\partial_tH(t,n)+\mathcal{L}_t^{u^_}H(t,n)+F(t,n,u^_)=0:.$$

Kết hợp kết quả này với (5.34), chúng ta thu được DPE (còn được gọi trong bối cảnh này là phương trình HamiltonJacobiBellman)

$$\overline{\left{\begin{matrix}\partial_tH(t,n)+\sup_{u\in\mathcal{A}_t}\left(\mathcal{L}_t^uH(t,n)+F(t,n,u)\right)=0:,\\H(T,n)=G(n):.\end{matrix}\right.}$$

Điều kiện đầu cuối tuân theo quan sát rằng tích phân trong bài toán tối ưu hóa (5.24) biến mất khi $t/T$ . Nhớ lại rằng bộ tạo $\mathcal{L}_{t}^{u}$ cho quá trình được kiểm soát hoạt động như sau:

$$\mathcal{L}_{t}^{u}H(t,n)=\lambda(t,n,u)\left[H(t,n+1)-H(t,n)\right]:.$$

Giống như trong trường hợp khuếch tán, việc tối ưu hóa bộ điều khiển trong (5.35) chỉ được thực hiện trên giá trị của nó tại thời điểm $t$, chứ không phải trên toàn bộ đường đi của bộ điều khiển. Do đó, có vẻ như bộ điều khiển tối ưu có thể thu được theo từng điểm. Coi hàm giá trị như đã biết, bộ điều khiển tối ưu thường có thể được tìm thấy ở dạng điều khiển phản hồi theo chính hàm giá trị. Việc thay thế bộ điều khiển phản hồi trở lại (5.35) thường dẫn đến các PDE phi tuyến tính. Trong trường hợp Poisson này, cực đại trong (5.35) có dạng rất đơn giản vì

$$\begin{aligned}\sup_{u\in\mathcal{A}_{t}}(\mathcal{L}_{t}^{u}H(t,n)+F(t,n,u))\&=\sup_{u\in\mathcal{A}_{t}}\left{\lambda(s,n,u)\left[H(t,n+1)-H(t,n)\right]+F(t,n,u)\right},\end{aligned}$$

và do đó, nếu $F=0$ ， lựa chọn tối ưu của bộ điều khiển là làm cho $\lambda(s,n,u)$ càng lớn càng tốt nếu $H(t,n+1)-H(t,n):>:0$ và càng nhỏ càng tốt nếu $H(t,n+1)-H(t,n)<0.$ Các bộ điều khiển như vậy được gọi là bộ điều khiển bang-bang vì đại lượng được điều khiển (trong trường hợp này là cường độ) đạt đến các điểm cực trị của nó. Để làm cho bài toán trở nên thú vị hơn, chúng ta cần (i) đưa vào một phần thưởng/hình phạt đang diễn ra (tức là $F^{\prime}\neq0$ ) hoặc, thú vị hơn (và có liên quan hơn), (ii) đưa ra một quá trình ngẫu nhiên khác được điều khiển bởi quá trình đếm, và do đó được điều khiển gián tiếp, và để quá trình ngẫu nhiên này ảnh hưởng đến phần thưởng cuối cùng và phần thưởng đang diễn ra của tác nhân.

Sử dụng quy trình Poisson để điều khiển quy trình điều khiển thứ cấp

Một cách như vậy để thực hiện điều này, cũng sẽ xuất hiện trong các chương sau do các vấn đề tối ưu hóa trong giao dịch thuật toán, là để $(X_{t}^{u})_{0\leq t\leq T}$ biểu thị một

quá trình được kiểm soát đáp ứng SDE

$$dX_t^u=\mu(t,X_t^u,N_t^u,u_t):dt+\sigma(t,X_{t^-}^u,N_{t^-}^u,u_t):dN_t^u:.$$

Theo cách này, quá trình đếm $N^{u}$ đóng vai trò là nguồn của các bước nhảy trong $X^{u}$ và bộ điều khiển U có thể điều chỉnh kích thước của các bước nhảy đó cũng như độ trôi của quá trình $X$ ngoài tốc độ đến của chính các bước nhảy.

Trong bối cảnh chung hơn này, tiêu chí hiệu suất có thể phụ thuộc vào cả $N$ và $X$. Cụ thể, hãy

$$\begin{đã căn chỉnh} &H(t,x,n) :=\sup_{u\in\mathcal{A}}H^{u}(t,x,n),\quad\mathrm{và} \\ &H^{u}(t,x,n) :=\mathbb{E}_{t,x,n}\left[:G(X_{T}^{u},N_{T}^{u})+\int_{t}^{T}:F(s,X_{s}^{u},N_{s}^{u},u_{s}):ds:\right], \end{đã căn chỉnh}$$

trong đó $\mathbb{E}{t,x,n}[\cdot]$ biểu thị kỳ vọng có điều kiện trên $N{t-}=n$ và $X_{t-}=x$. Theo cùng lập luận như trong các phần trước, DPP cho bài toán này có thể được viết như sau:

$$H(t,x,n)=\sup\limits_{u\in\mathcal{A}}\mathbb{E}_{t,x,n}\left[H\left(\tau,X_\tau^u,N_\tau^u\right)+\int_t^\tau F\left(s,X_s^u,N_s^u,u_s\right):ds\right]:,$$

và một DPE có thể được suy ra để tìm

$$\left.\left{\begin{array}{ll}\partial_tH(t,x,n)+\sup\limits_{u\in\mathcal{A}}\left(\mathcal{L}_t^uH(t,x,n)+F(t,x,n)\right)=0:,\\H(T,x,n)=G(x,n):.\end{array}\right.\right.$$

Ở đây, máy phát vô cùng nhỏ $\mathcal{L}_{t}^{u}$ hoạt động như sau:

$$\begin{aligned}\mathcal{L}_{t}^{u}H(t,x,n)&=\mu(t,x,n,u):\partial_{x}H(t,x,n)\&+\lambda(t,x,n,u)\left[H(t,:x+\sigma(t,x,n,u),:n+1)-H(t,:x,:n)\right]:.\end{aligned}$$

Lưu ý rằng điều khiển xuất hiện trong cả hệ số cường độ và toán tử hiệu, và có một đạo hàm riêng đối với biến trạng thái $JL$. Điều này thể hiện sự đánh đổi giữa việc tăng/giảm cường độ thông qua điều khiển và tác động của sự thay đổi đó đối với quá trình $X_{t}^{u}$, cũng như tác động của điều khiển đối với độ trôi

Ví dụ: Tối đa hóa giá trị tài sản mong đợi bằng cách sử dụng giao dịch khứ hồi

Ở đây, chúng tôi cung cấp một ví dụ về một đại lý sử dụng lệnh thị trường (MO) để mua một cổ phiếu với giá chào bán tốt nhất và sau đó tìm cách tháo gỡ vị thế của mình bằng cách đặt một lệnh giới hạn (LO) ở mức giá trung bình cộng với độ sâu U mà cô ấy kiểm soát. Cô ấy lặp lại thao tác này nhiều lần cho đến một ngày trong tương lai $I$ Chi phí của cô ấy khi mua cổ phiếu là $S_{t}+\Delta/2$ , trong đó $\Delta$ là chênh lệch giữa giá mua tốt nhất và giá bán tốt nhất và được coi là không đổi, và vì $S_{t}$ là giá trung bình, nên giá bán tốt nhất nằm trong LOB tại $S_{t}+\Delta/2$ . Doanh thu từ việc bán (nếu LO của cô ấy được nâng lên bởi MO) là $S_{t}+u_{t}$ Do đó, tài sản tích lũy cho đại lý từ giao dịch khứ hồi này là $u_{t}-\Delta/2$

Tuy nhiên, không có gì đảm bảo rằng LO bán sẽ được lấp đầy và trong trường hợp này, tài sản của tác nhân $X$ thỏa mãn (5.36) với $\mu=0$ và $\sigma_{t}^{u}=\left(u_{t}-\frac{\Delta}{2}\right)$ sao cho

$$dX_t^u=\begin{pmatrix}u_t-\frac{\Delta}{2}\end{pmatrix}:dN_t^u:.$$

Tại đây $N_{t}^{u}$ đếm số lượng giao dịch khứ hồi mà tác nhân đã hoàn thành cho đến thời điểm $t$. Tác nhân kiểm soát cường độ của quá trình đếm này vì cô ấy chọn $UL$ càng lớn thì xác suất LO của cô ấy được lấp đầy càng thấp.

Có nhiều cách để chúng ta có thể mô hình hóa xác suất LO được lấp đầy khi biết độ sâu trong LOB mà tác nhân đăng lệnh. Chúng ta cần hai thành phần. Đầu tiên, chúng ta cần giả định tỷ lệ đến cho các MO mua được gửi bởi những người tham gia thị trường khác. Ở đây, để đơn giản, chúng ta giả định rằng tỷ lệ này là một hằng số $\Lambda>0$. Thành phần khác là xác suất LO được lấp đầy có điều kiện là MO đến. Một lựa chọn phổ biến trong tài liệu là giả định rằng khi đăng $u\geq0$ cách xa mức giá trung bình, xác suất được lấp đầy, với điều kiện là MO đến, là $P(u)=e^{-\kappa:u_{t}}$ và một lựa chọn khác là $P(u)=(1+\kappa:u_{t})^{-\gamma}$ trong đó K và $\gamma$ là các hằng số dương. Việc kết hợp các thành phần này lại với nhau mang đến cho chúng ta hai lựa chọn để mô hình hóa xác suất lấp đầy: $\lambda_{t}^{u}=e^{-\kappa:u_{t}}$ A và $\lambda_{t}^{u}=(1+\kappa:u_{t})^{-\gamma}:\Lambda$ Để giải quyết vấn đề tối ưu hóa của tác nhân, chúng tôi sử dụng tiêu chí hiệu suất và

hàm giá trị như trong (5.37) với $F^{\prime}=0$ và $G(x,n)=x$ . Nếu chúng ta giả sử rằng tỷ lệ lấp đầy là $\lambda_{t}^{u}=e^{-\kappa:u_{t}}:\Lambda$ , DPE trở thành

$$\partial_{t}H+\sup_{u\geq0}\Lambda:e^{-\kappa:u}\left(H(t,x+\left(u-\frac{1}{2}\Delta\right),n+1)-H(t,x,n)\right)=0:,$$

với $H(T,x,n)=x.$ Vì không có sự phụ thuộc rõ ràng vào chính 71, ta có thể giả sử $H(t,x,n)=h(t,x)$ nên hàm giá trị chỉ phụ thuộc vào tài sản và thời gian. Hơn nữa, do tính chất tuyến tính của bài toán, ta có thể viết thêm $h(t,x)=x+g(t)$ cho một hàm xác định $g(t)$ nào đó với điều kiện cuối $g(T)=0$. Do đó, phương trình trên được rút gọn thành

$$\partial_tg+\sup\limits_{u\ge0}\Lambda:e^{-\kappa:u}\left(u-\frac{1}{2}\Delta\right)=0:.$$

Điều này cho thấy rằng kiểm soát tối ưu không phụ thuộc vào $t$ ， 32 và $7L$ . Cụ thể,

$$u^_=\underset{u\geq0}{\operatorname_{argmax}}\left{e^{-\kappa:u}\left(u-\frac{1}{2}\Delta\right)\right}:,$$

và thật dễ dàng để chứng minh rằng

$$u^*=\frac12\Delta+\frac1\kappa:.$$

Không khó để kiểm tra xem đây có thực sự là giá trị cực đại chứ không phải cực tiểu hay không, và khi thay thế điều khiển phản hồi (trong trường hợp này chỉ là hằng số) trở lại (5.40), chúng ta thấy rằng $g$ thỏa mãn

$$\partial_tg+\frac{\Lambda}{\kappa}:e^{-\kappa\left(\frac{1}{2}\Delta+\frac{1}{\kappa}\right)}=0:.$$

Do đó, hàm giá trị được đưa ra bởi biểu thức rất nhỏ gọn

$$H(t,x,n)=x+\frac{\Lambda}{\kappa}:e^{-\kappa\left(\frac{1}{2}\Delta+\frac{1}{\kappa}\right)}:(Tt):.$$

Chiến lược ghi sổ tối ưu (5.4.2) có một cách diễn giải đơn giản. Tác nhân phải thu hồi chi phí chênh lệch giá một nửa đã phát sinh khi sử dụng MIO để mua tài sản, và điều này được biểu thị bằng $\frac{1}{2}\Delta$ trong ghi sổ tối ưu (5.4.2). Ngoài ra, tác nhân ghi sổ xa hơn giá trung bình một lượng sao cho tối đa hóa độ sâu mà giá trị ghi sổ của cô ấy có thể nằm trong sổ, với xác suất được điền đầy, và đây là số hạng $\frac{1}{N_{6}}$. Chiến lược được rút ra ở đây là tối ưu, nhưng đơn giản vì nó là kết quả của

đơn giản hóa các giả định trong cách chúng ta mô hình hóa các biến trạng thái và các tiêu chí hiệu suất đơn giản được tác nhân sử dụng. Ví dụ, chiến lược này không thực hiện bất kỳ điều chỉnh nào đối với việc ghi nhận tối ưu dựa trên số lượng và chi phí quan trọng như: hàng tồn kho tích lũy, tài sản, thời gian giao dịch còn lại và chi phí lựa chọn bất lợi. Các nguyên tắc kinh tế làm nền tảng cho mối liên hệ giữa các số lượng và chi phí này với việc ghi nhận tối ưu đã được thảo luận trong Chương 2. Trong các phần sau của cuốn sách này, chúng tôi kết hợp những vấn đề này vào các chiến lược giao dịch khi phát triển các thuật toán, trong đó tác nhân tối đa hóa lợi nhuận bằng cách thực hiện các giao dịch khứ hồi trong một bối cảnh thực tế và tổng quát hơn so với bối cảnh được phát triển ở đây.

Kết hợp khuếch tán và nhảy

Như đã gợi ý ở trên, có nhiều tình huống mà tác nhân phải đối mặt với nhiều hơn một nguồn bất định. Thông thường, tác nhân phải đối mặt với các bài toán điều khiển, trong đó cả bất định khuếch tán và bất định nhảy đều xuất hiện, và tác nhân đó có thể kiểm soát toàn bộ hoặc chỉ một phần của hệ thống. Những tình huống như vậy sẽ xuất hiện trong một số bài toán giao dịch thuật toán phát sinh trong các phần tiếp theo, và ở đây chúng tôi chỉ trình bày các kết quả chính cho một lớp mô hình khá tổng quát. Trước tiên, giả sử $N^{\boldsymbol{u}}:=:(N_{t}^{\boldsymbol{u}})_{0\leq t\leq T}$ biểu thị một tập hợp các quy trình đếm (của

dim $P$ ) với cường độ được kiểm soát $\lambda^{u}:=:(\lambda_{t}^{u}){0\leq t\leq T}$ ， và để $u:=:(u{t}){0\leq t\leq T}$ biểu thị các quá trình điều khiển (của dim $TH$ ). Hơn nữa, để $W:=:(W{t}){0\leq t\leq T}$ biểu thị một tập hợp các chuyển động Brown độc lập (của dim m). Tiếp theo, để $X^{u}=$ $(X{t}^{\boldsymbol{u}}){0\leq t\leq T}$ biểu thị các quá trình được kiểm soát (của dim 711 ) sẽ xuất hiện trực tiếp trong tiêu chí hiệu suất của tác nhân. Nếu một (hoặc nhiều hơn) các quá trình đếm $N{t}^{r^{\prime}}$ xuất hiện trong tiêu chí hiệu suất hoặc trong sự phụ thuộc trong $\mu_{t}^{u}$ ， $\sigma_{t}^{u}$ và/hoặc $\gamma_{t}^{u}$ , được hiển thị bên dưới, thì lấy $X_{t}^{j}=N_{t}^{\bar{\boldsymbol{\imath}}}$ đối với một số $j$ , tức là bao gồm nó thông qua một trong các thành phần trong $X$ . Tiếp theo, chúng ta giả định rằng các quá trình $X^{u}$ được kiểm soát thỏa mãn các SDE

$$dX_t^u=\mu_t^u:dt+\sigma_t^u:dW_t+\gamma_t^u:dN_t^u:.$$

Với một chút lạm dụng ký hiệu, chúng ta viết độ trôi, độ biến động và bước nhảy được kiểm soát

kích thước như

$$\begin{thu thập} \mu_{t}^{u} :=\mu(t,X_{t}^{u},u_{t}):, \left(m\times1:\mathrm{vector}\right), \\ \sigma_t^{u} :=\sigma(t,X_{t}^{u},u_{t}):, m\times m:\mathrm{matrix}):, \\ \gamma_{t}^{u} :=\gamma(t,X_{t}^{u},u_{t}):, (m\times p\mathrm{~matrix}):. \end{thu thập}$$

Hơn nữa, chúng tôi giả định rằng cường độ được kiểm soát có dạng

$$\lambda_t^u:=\lambda\left(t,X_t^u,u_t\right):.$$

Phương pháp mô hình hóa ở trên ngụ ý rằng tác nhân có thể kiểm soát, nói chung, độ trôi, độ biến động, kích thước bước nhảy và số lần nhảy đến. Mức độ kiểm soát chính xác của tác nhân phụ thuộc vào dạng cụ thể của các hàm khác nhau xuất hiện trong (5.41b), (5.41c), (5.41d) và (5.41e). Tiêu chí hiệu suất của tác nhân được đưa ra bởi

$$H^{\boldsymbol{u}}(t,\boldsymbol{x})=\mathbb{E}_{t,\boldsymbol{x}}\left[G\left(\boldsymbol{X}_{T}^{\boldsymbol{u}}\right)+\int_{t}^{T}F\left(s,\boldsymbol{X}_{s}^{\boldsymbol{u}},\boldsymbol{u}_{s}\right):ds\right]:,$$

và hàm giá trị sau đó được đưa ra bởi biểu thức thông thường

$$H(t,\boldsymbol{x})=\sup_{\boldsymbol{u}\in\mathcal{A}_{[t,T]}}H^{\boldsymbol{u}}(t,\boldsymbol{x}):.$$

Lặp lại quá trình phân tích theo hướng tương tự như các phần trước, chúng ta sẽ có được DPP cho bài toán kết hợp.

ĐỊNH LÝ 5.4 Nguyên lý quy hoạch động cho khuếch tán nhảy. Hàm giá trị (5.42) thỏa mãn DPP

$$\overline{H(t,x)=\sup_{u\in\mathcal{A}_{[t,T]}}\mathbb{E}_{t,x}\left[H(\tau,X_{\tau}^{u})+\int_{t}^{\tau}F(s,X_{s}^{u},u_{s}):ds\right]:,}$$

với mọi $(t,x)\in[0,T]\times\mathbb{R}^{m}$ và mọi thời điểm dừng $\tau\leq T$

Hơn nữa, theo những lập luận tương tự như trước, người ta có thể phát triển một DPE

$$\overline{\left{\begin{matrix}\partial_tH(t,x)+\sup_{u\in A_t}\left(\mathcal{L}_t^uH(t,x)+F(t,x,u)\right)=0:,\\H(T,x)=G(x):,\end{matrix}\right.}$$

trong đó máy phát vô cùng nhỏ $L_{t}^{u}$ hoạt động như sau:

$$\begin{đã căn chỉnh} \mathcal{L}_{t}^{u}H(t,x)=& \mu(t,x,u)\cdot D_{x}H(t,x)+\frac{1}{2}\sigma(t,x,u)\sigma(t,x,u)^{\prime}D_{x}^{2}H(t,x) \\ &+\sum_{j=1}^{p}\lambda_{j}(t,\boldsymbol{x},\boldsymbol{u})\left[H(t,:\boldsymbol{x}+\gamma_{\cdot j}(t,\boldsymbol{x},\boldsymbol{u}))-H(t,\boldsymbol{x})\right]:, \end{đã căn chỉnh}$$

trong đó $\gamma_{\cdot j}$ biểu thị vectơ tương ứng với cột thứ $j^{th}$ của $\gamma$ · $D_{x}H$ biểu diễn vectơ của các đạo hàm riêng theo $3E$ và $D_{x}^{2}H$ biểu diễn ma trận của các đạo hàm riêng bậc hai (hỗn hợp) theo $3L$

Các số hạng khác nhau trong trình tạo có thể được diễn giải dễ dàng: ở dòng đầu tiên, số hạng đầu tiên biểu diễn độ trôi (có kiểm soát) của $X$, và số hạng thứ hai biểu diễn độ biến động (có kiểm soát) của $X$ ; ở dòng thứ hai, cường độ cho mỗi quá trình đếm được hiển thị riêng biệt và mỗi số hạng trong tổng có tốc độ (có kiểm soát) đến của thành phần nhảy đó qua $\lambda_{j}$, các số hạng khác biệt xuất hiện là do bước nhảy đến và khiến thành phần đó của $N$ tăng lên, đồng thời khiến (có khả năng là tất cả các thành phần của) $X$ nhảy một lượng $\Upsilon\cdot j$

5.5 Dừng tối ưu

Trong nhiều trường hợp, tác nhân muốn tìm thời điểm tốt nhất để tham gia hoặc thoát khỏi một chiến lược nhất định. Ví dụ tài chính cổ điển về điều này là ^quyền chọn bán kiểu Mỹ' trong đó tác nhân sở hữu quyền chọn có quyền, tại bất kỳ thời điểm nào cho đến và bao gồm cả ngày đáo hạn $T$ , để thực hiện quyền chọn bằng cách nhận số tiền mặt $K$ để đổi lấy tài sản cơ sở. Giá trị tiền mặt ròng của giao dịch này tại ngày thực hiện '1 là $(K-S_{\tau})$ . Đương nhiên, tác nhân sẽ không thực hiện khi $S_{\tau}>K$ , do đó, khoản thanh toán thực tế là $(K-S_{\tau}){+}$ trong đó $(\cdot){+}=\max(\cdot,0)$ . Quan sát đơn giản này chỉ cung cấp một phần nhỏ của chiến lược: để xác định chiến lược đầy đủ, tác nhân tìm kiếm thời điểm dừng 'I tối đa hóa giá trị chiết khấu của phần thưởng, tức là cô ấy tìm kiếm thời điểm dừng đạt đến giá trị tối đa (nếu có thể)

$$\sup\limits_{\tau\in\mathcal{T}}\mathbb{E}\left[e^{-r:\tau}\left(K-S_{\tau}\right)_{+}\right]:,$$

trong đó 7 là thời gian dừng $J$ bị giới hạn bởi $T.$. Đây chỉ là một trong nhiều bài toán như vậy, và nói chung, các bài toán tìm kiếm thời gian dừng tối ưu được gọi là bài toán dừng tối ưu. Tương tự như các bài toán điều khiển tối ưu, các bài toán dừng tối ưu chấp nhận một DPP và có một phiên bản vô cùng nhỏ, tức là một DPE. Trong phần này, chúng tôi cung cấp một phác thảo ngắn gọn về DPP và DPE cho các bài toán dừng tối ưu. Thay vì phát triển trường hợp khuếch tán trước, sau đó là bước nhảy, rồi đến

khuếch tán nhảy, ở đây chúng ta bắt đầu ngay với một mô hình khuếch tán nhảy khá tổng quát. Với mục đích này, hãy để $X=(X_{t})_{0\leq t\leq T}$ biểu thị một quá trình vectơ có giá trị dim 7772 thỏa mãn SDE

$$dX_t=\boldsymbol{\mu}(t,\boldsymbol{X}_t):dt+\boldsymbol{\sigma}(t,\boldsymbol{X}_t):d\boldsymbol{W}_t+\boldsymbol{\gamma}(t,\boldsymbol{X}_t):d\boldsymbol{N}_t:,$$

trong đó $\mu:[0,T]\times\mathbb{R}^{m}\mapsto\mathbb{R}^{m}$ · $\sigma:[0,T]\times\mathbb{R}^{m}\mapsto\mathbb{R}^{m}\times\mathbb{R}^{m}$ ， $\gamma:[0,T]\times\mathbb{R}^{m}\mapsto$ $\mathbb{R}^{m}\times\mathbb{R}^{m}$ ， $W$ là chuyển động Brown 772 chiều với các thành phần độc lập và $N$ là quá trình đếm 771 chiều với cường độ $\lambda(t,X_{t})$ Lọc $JF$ là lọc tự nhiên được tạo ra bởi $X$ và là bộ tạo của

quá trình $\mathcal{L}{t}$ tác động lên các hàm khả vi hai lần như sau: $$\begin{thu thập} \mathcal{L}{t}h(t,x) =\mu(t,x)\cdot D_{x}h(t,x)+\frac{1}{2}Tr\sigma(t,x)\sigma(t,x)^{\prime}D_{x}^{2}h(t,x) \ +\sum_{j=1}^{p}\lambda_{j}(t,x)\left[h(t,x+\gamma_{.j}(t,x))-h(t,x)\right]:. \end{thu thập}$$

Nhớ lại rằng $D_{x}h$ biểu diễn vectơ của các đạo hàm riêng theo 2 và $D_{x}^{2}h$ biểu diễn ma trận của các đạo hàm riêng bậc hai (hỗn hợp) theo $2E$ Sau đó, tác nhân có một tiêu chí hiệu suất, cho mỗi thời điểm dừng $JF$ $\tau\in$

$T_{[t,T]}$ , được đưa ra bởi

$$H^\tau(t,\boldsymbol{x})=\mathbb{E}_{t,\boldsymbol{x}}\left[:G(\boldsymbol{X}_\tau):\right]:,$$

trong đó $G(X_{\tau})$ là phần thưởng khi tập thể dục và cô ấy muốn tìm hàm giá trị

$$H(t,\boldsymbol{x})=\sup_{\tau\in\mathcal{T}_{[t,T]}}H^{\tau}(t,\boldsymbol{x}):,$$

và thời gian dừng 7 đạt giá trị cực đại nếu nó tồn tại. Thoạt nhìn, có vẻ như chúng ta đã bỏ qua phần thưởng/hình phạt đang chạy $\int_{t}^{\tau}F(s,X_{s}):ds$ mà chúng ta đã đưa vào khi nghiên cứu điều khiển tối ưu. Tuy nhiên, các số hạng như vậy có thể được đưa về dạng trên bằng cách chọn một trong các thành phần của $X$, chẳng hạn $X^{1}$, để thỏa mãn

$$dX_t^1=F(t,X_t^2,\ldots,X_t^m):dt:,$$

và viết $G(x):=:x^{1}:+:\dot{G}(x^{2},\ldots,x^{m})$ . Do đó, không mất tính tổng quát khi chỉ xét đến phần thưởng cuối cùng. Trong trường hợp điều khiển ngẫu nhiên, chúng ta giữ nguyên phần thưởng/hình phạt đang chạy rõ ràng vì nó thường xuất hiện ở đó. Bây giờ, việc hấp thụ phần thưởng/hình phạt đang chạy trong $G$ sẽ thuận tiện hơn. Tương tự, chúng ta có thể kết hợp chiết khấu bằng cách đưa vào một quy trình trạng thái thứ hai bằng với hệ số chiết khấu cho đến thời điểm đó và sửa đổi $G$ cho phù hợp. Từ việc đặt ra bài toán dừng trong (5.45), một cách trực quan, ta thấy rằng

Tác nhân đang cố gắng quyết định giữa việc dừng lại 'ngay bây giờ' và nhận phần thưởng $G$, hoặc tiếp tục trì hoãn với hy vọng nhận được phần thưởng lớn hơn trong tương lai. Tuy nhiên, khi xem xét kỹ hơn, có vẻ rõ ràng rằng tác nhân nên tiếp tục chờ tại điểm $(t,\boldsymbol{x})\in[0,T]\times\mathbf{R}^{m}$ miễn là hàm giá trị chưa đạt giá trị $G(x)$ tại đó. Điều này thúc đẩy việc định nghĩa vùng dừng $S$, mà chúng ta định nghĩa là

$$\mathcal{S}=\left{(t,x)\in[0,T]\times\mathbb{R}^{m}:::H(t,x)=G(x)\right}.$$

Rõ ràng là bất cứ khi nào $(t,x)\in S$, tức là nếu trạng thái của hệ thống nằm trong S , thì việc dừng ngay lập tức là tối ưu - vì tác nhân không thể cải thiện vượt quá $G$ theo định nghĩa của hàm giá trị trong (5.45). Phần bù của vùng này, $S^{c}$, được gọi là vùng tiếp tục. Trong vùng này, tác nhân vẫn có thể cải thiện giá trị của mình và do đó tiếp tục chờ. Cả hai vùng có thể được hình dung một cách tổng quát như trong Hình 5.3.

Những khó khăn trong các vấn đề dừng tối ưu phát sinh do vùng S (hoặc

Hình 5.3 Mô tả chung về vùng tiếp tục và vùng dừng cho bài toán dừng tối ưu (5.45). Một đường dẫn mẫu cũng được hiển thị và chấm đỏ tương ứng với thời điểm dừng tối ưu.

tương đương, biên $\partial S$ của nó phải được giải đồng thời với chính hàm giá trị. Do đó, các phương trình vi phân tuyến tính (DPE) phát sinh trong bối cảnh này là các bài toán biên tự do, còn được gọi là bài toán chướng ngại vật, hoặc bất đẳng thức biến phân. Các phương trình vi phân tuyến tính (PDE) như vậy khó giải hơn, và ngay cả những ví dụ rất đơn giản cũng thường không cho phép các nghiệm rõ ràng, ví dụ như quyền chọn bán kiểu Mỹ khi tài sản cơ sở là chuyển động Brown hình học. Tuy nhiên, một phương trình vi phân tuyến tính (PDE) phi tuyến tính thường đủ để mô tả nghiệm và có nhiều sơ đồ số để giải chúng.

5.5.1 Nguyên lý lập trình động

Suy luận theo hướng tương tự như trước, chúng ta có thể chứng minh rằng DPP sau đây được áp dụng.

ĐỊNH LÝ 5.5 Nguyên lý lập trình động để dừng các vấn đề. Hàm giá trị (5.45) thỏa mãn DPP

$$\đóng hộp{\quad H(t,x)=\sup_{\tau\in\tau_{|t,T|}}\mathbb{E__{t,x}\left[:G(X_{\tau}):\mathbf{ 1__{\tau<\theta}+H(\theta,X_{\theta}):\mathbf{1__{\tau\geq\theta}\right]:,}$$

với mọi $(t,\boldsymbol{x})\in[0,T]\times\mathbf{R}^{m}$ và mọi thời điểm dừng $\theta\leq T$

Trực giác của DPP này là nếu thời điểm dừng tối ưu $\tau^{}$ xảy ra trước $\theta$, thì hàm giá trị của tác nhân bằng phần thưởng tại $\tau^{}$. Tuy nhiên, nếu tác nhân chưa dừng lại trước $\theta$, thì tại $t$, tác nhân sẽ nhận được hàm giá trị được đánh giá ở trạng thái hiện tại của hệ thống.

5.5.2 Phương trình lập trình động

Như trong các bài toán điều khiển tối ưu đã nghiên cứu trước đó, DPP cho việc dừng tối ưu có thể được viết lại ở dạng vô cùng nhỏ - một dạng hữu ích hơn nhiều cho tính toán, tức là có thể được sử dụng để suy ra DPE. Lần này, chúng tôi phát biểu kết quả trước rồi mới đưa ra chứng minh. Chúng tôi theo sát chứng minh trong Touzi (2013) vì nó cung cấp một giải pháp thay thế tốt cho cách xây dựng thông thường. Nó cũng mở ra cánh cửa cho

Người đọc quan tâm có thể tiếp tục nghiên cứu phương pháp giải quyết độ nhớt để kiểm soát tối ưu ngẫu nhiên và dừng tối ưu, phương pháp này chủ yếu dựa vào phương pháp chứng minh bằng phản chứng được áp dụng ở đây.

ĐỊNH LÝ 5.6 Phương trình Quy hoạch Động cho Bài toán Dừng. Giả sử hàm giá trị $H(t,x)$ khả vi một lần trong $t$ và mọi đạo hàm bậc hai trong $UL$ đều là hằng số, tức là $H\in C^{1,2}([0,T],\mathbb{R}^{m})$, và $G:\mathbb{R}^{m}\mapsto$ R là liên tục. Khi đó $H$ giải bất đẳng thức biến phân, còn được gọi là bài toán chướng ngại vật, hay bài toán biên tự do:

$\max\quad \partial_{t}H+\mathcal{L}{1}H,\ GH\Big|{0}=0,\ trên\ D,$

trong đó ${\mathcal D}=[0,T]\times{\mathbf R}^{m}$

Chứng minh Chứng minh được chia thành hai bước bằng cách chứng minh (trên $\mathcal{D}$ ) rằng (i) vế trái đầu tiên nhỏ hơn hoặc bằng không, và (i) theo mâu thuẫn, vế trái cũng lớn hơn hoặc bằng không. Do đó, đẳng thức phải được giữ nguyên.

(i) Đầu tiên chúng ta thiết lập rằng

$$\max\left{\begin{array}{c}\partial_tH+\mathcal{L}_tH:,:GH\\end{array}\right}\leq0:,\quad\mathrm{on}\quad\mathcal{D}:.$$

Để chứng minh điều này, trước tiên hãy lưu ý rằng quy tắc dừng hằng số $\tau=t$ là chấp nhận được. Do đó, tiêu chí hiệu suất của quy tắc hằng số này bằng $G$ và chúng ta phải có $H\geq G$ sao cho $GH\leq0$

Tiếp theo, lấy bất kỳ điểm $(t_0,x_0)\in{\mathcal{D}}$ nào. Chúng ta chứng minh rằng bất đẳng thức mong muốn được thỏa mãn tại điểm này. Xét chuỗi thời gian dừng được chỉ số bởi $h>0$

$$\theta_{h}=\inf\left{t>t_{0}:::(t,||\boldsymbol{X}_{t}-\boldsymbol{x}_{0}||)\notin[t_{0},t_{0}+h]\times1\right},$$

trong đó $\left|\left|\cdot\right|\right|$ biểu thị chuẩn Euclid. Nghĩa là, ta lấy thời gian dừng bằng giá trị nhỏ nhất của $t_{0}+h$ và thời gian cần thiết để $X$ thoát khỏi một quả bóng kích thước l từ vị trí hiện tại của nó. Miễn là $h<T^{\prime}-t_{0}$, thì đây là thời gian dừng chấp nhận được. Do đó, bằng cách lấy $\tau=t_0$, DPP (5.46) suy ra rằng

$$H(t_0,\boldsymbol{x}_0)\geq\mathbb{E}_{t_0,\boldsymbol{x}_0}\left[:H:(\theta_h,\boldsymbol{X}_{\theta_h}):\right]:.$$

Sau đó, chúng tôi mở rộng thuật ngữ theo kỳ vọng bằng cách sử dụng định lý Ito cho phép khuếch tán nhảy để viết $$\begin{đã căn chỉnh} &H\left(\theta_{h},X_{\theta_{h}}\right) \ &=:H(t_0,x_0) \ &+\int_{t_{0}}^{\theta_{h}}\Big{\partial_{t}H(t,X_{t})+\mathcal{L}{t}H(t,X{t})\Big}dt+\int_{t_{0}}^{\theta_{h}}(\sigma(t,X_{t}):D_{x}H(t,X_{t}))^{\prime}:dW_{t} \ &+\sum_{j=1}^{p}\int_{t_{0}}^{\theta_{h}}\left[H\left(t,X_{t}+\gamma_{.j}(t,X_{t})\right)-H\left(t,X_{t}\right)\right]d\widehat{N}_{t}^{j}, \end{đã căn chỉnh}$$

trong đó $\widehat{N}{t}=N{t}-\int_{0}^{t}\lambda(s,\boldsymbol{X}{s}):ds$ là các phiên bản bù của quá trình đếm và $\gamma{\cdot j}$ biểu thị cột thứ $j^{$ của $\gamma$

Vì thời gian dừng $\theta_{h}$ được chọn sao cho quá trình $X$ vẫn bị chặn bởi quả bóng có kích thước l xung quanh ${:}\boldsymbol{L}_{0}$ cộng với thế năng của một bước nhảy (mà chúng ta giả sử bị chặn), nên tích phân ngẫu nhiên đối với cả chuyển động Brown và các quá trình đếm bù đều bằng không theo kỳ vọng. Do đó, chúng ta có

$$0\geq\mathbb{E}_{t_0,\boldsymbol{x}_0}\left[\int_{t_0}^{\theta_h}\left{\partial_tH(t,\boldsymbol{X}_t)+\mathcal{L}_tH(t,\boldsymbol{X}_t)\right}dt\right]:.$$

Chia cho $h.$ và lấy $h\searrow0$, trong trường hợp đó $\theta_{h}\searrow h$ là (vì $X_{t}$ sẽ không chạm vào cạnh của quả bóng giới hạn), Định lý Giá trị Mlean ngụ ý rằng

$$\partial_{t}H(t,x_{0})+\mathcal{L}_{t}H(t_{0},x_{0})\leq0:.$$

Như vậy là hoàn thành phần đầu tiên của bằng chứng.

(i) Tiếp theo chúng ta chứng minh bằng phản chứng rằng

$$\max\left{\begin{array}{c}\partial_tH+\mathcal{L}_tH:,:GH\\end{array}\right}\ge0:,\quad\mathrm{on}\quad\mathcal{D}:.$$

Nếu bất đẳng thức trên không đúng trên $\mathcal{D}$ thì tồn tại một điểm $(t_0,x_0)\in$ $\mathcal{D}$ sao cho

$$G(t_0,x_0)-H(t_0,x_0)<0\quad\textbf{và}\quad(\partial_t+\mathcal{L}_t)H(t_0,x_0)<0:.$$

Chúng tôi chứng minh rằng (5.48) mâu thuẫn với DPP trong (5.46). Để đạt được mục đích này, hãy giới thiệu một hàm mới $\varphi_{\varepsilon}$ xấp xỉ hàm giá trị gần ( $t_{0}$ ， ${\mathcal{L}}$ ） nhưng chi phối cục bộ hàm này:

$$\varphi_{\varepsilon}(t,x):=H(t,x)+\varepsilon\left(||x-x_{0}||^{4}+|t-t_{0}|^{2}\right):,\quad\forall(t,x)\in\mathcal{D}:,\quad\varepsilon>0.$$

Theo giả thiết (5.48), với $\varepsilon>0$ nhưng đủ nhỏ, tồn tại một lân cận nhỏ xung quanh $(t_0,x_0)$ mà hàm giá trị lớn hơn ít nhất $\delta$ phần thưởng $G$ và với nó toán tử $(\partial_{t}+\mathcal{L}_{t})$ làm cho xấp xỉ $\psi\varepsilon$ âm. Chính xác hơn, tồn tại $h>0$ và $\delta>0$ sao cho

$$H\geq G+\delta\quad\mathrm{và}\quad(\partial_{t}+\mathcal{L}_{t}):\varphi_{\varepsilon}\leq0\quad\mathrm{on}\quad\mathcal{D}_{h}:=[t_{0},t_{0}+h]\times\mathcal{B}_{h}:,$$

trong đó $B_{h}$ là một quả bóng có kích thước $h.$ xung quanh $iE0$, tức là $\mathcal{B}{h}={x\in\mathbb{R}^{m}::||x-x{0}||\leq h}$ Ngoài ra, gần $(t_0,x_0)$ ， $\varphi e$ lớn hơn cục bộ $H$, do đó,

$$-\zeta:=\max_{\partial\mathcal{D__{h}}(H-\varphi_{\varepsilon})<0:,$$

trong đó $\partial{\mathcal{D}}{h}$ biểu diễn ranh giới của tập hợp $D{k}$

Bây giờ chúng ta lấy thời gian dừng bằng thời điểm đầu tiên quá trình thoát khỏi quả bóng này:

$$\theta:=\inf\left{\begin{mảng}{ccc}t>t_0&:&(t,X_t)\notin\mathcal{D}_h\end{mảng}\right}.$$

Lấy quy tắc dừng thứ hai, lần này là tùy ý, $\tau\in\mathcal{T}_{[t,T]}$ và đặt $\psi=\tau\wedge\theta$ Khi đó ta có

$$\begin{aligned}&H(\psi,:X_{\psi})-H(t_{0},x_{0})\&=(H-\varphi_{\epsilon})(\psi:,:X_{\psi})+(\varphi_{\epsilon}(\psi:,:X_{\psi})-\varphi_{\epsilon}(t_{0},x_{0})):,\end{aligned}$$

vì $\Psi_{\epsilon}$ và $H$ trùng nhau tại $(t_0,x_0)$ .Từ định lý Ito và thực tế là $X_{\psi}$ bị chặn do dừng lại lần đầu tiên $X$ thoát khỏi quả bóng $B_{h}$ , ta có

$$\mathbb{E}_{t_0,\boldsymbol{x}_0}\left[\varphi_\epsilon(\psi:,:\boldsymbol{X}_\psi)-\varphi_\epsilon(t_0,\boldsymbol{x}_0)\right]=\mathbb{E}_{t_0,\boldsymbol{x}_0}\left[\int_{t_0}^\psi\left(\partial_t+\mathcal{L}_t\right)\varphi_\epsilon(t,\boldsymbol{X}_t):dt\right]\leq0:.$$

Các điều khoản khuếch tán và nhảy biến mất vì chúng là martingale, và bất đẳng thức tuân theo bất đẳng thức thứ hai trong (5.49)

Do đó, kết hợp điều này với (5.51), chúng ta có

$$\mathbb{E}_{t_{0},\boldsymbol{x}_{0}}\left[H(\psi,:\boldsymbol{X}_{\psi})-H(t_{0},\boldsymbol{x}_{0})\right]\leq\mathbb{E}_{t_{0},\boldsymbol{x}_{0}}\left[(H-\varphi_{e})(\psi:,:\boldsymbol{X}_{\psi})\right]\leq-\zeta:\mathbb{P}(\tau\geq\theta):,$$

trong đó bất đẳng thức thứ hai suy ra từ (5.50). Bằng cách sắp xếp lại để cô lập $H(t_{0},x_{0})$, ta có

$$\begin{aligned}H(t_{0},x_{0})&\geq\zeta:\mathbb{P}(\tau\geq\theta)+\mathbb{E}_{t_{0},x_{0}}\left[H(\psi:,:X_{\psi})\right]\&=\zeta:\mathbb{P}(\tau\geq\theta)+\mathbb{E}_{t_{0},x_{0}}\left[H(\tau:,:X_{\tau})\mathbb{1}_{\tau<\theta}+H(\theta:,:X_{\theta})\mathbb{1}_{\tau\geq\theta}\right]:.\end{aligned}$$

Theo bất đẳng thức đầu tiên trong (5.49), $H\geq G+\delta$ trên $D_{h}$ , do đó

$$H(t_{0},x_{0})\geq\zeta:\mathbb{P}(\tau\geq\theta)+\mathbb{E}_{t_{0},x_{0}}\left[(G(X_{\tau})+\delta):\mathbb{1}_{\tau<\theta}+H(\theta:,:X_{\theta})\mathbb{1}_{\tau\geq\theta}\right]:,$$

trong đó chúng ta đã thay thế $H(\tau:,:X_{\tau})$ bằng giới hạn dưới của nó $(G(X_{\tau})+\delta)$ 0n1 ${\tau<\theta}$ vì trong trường hợp đó chúng ta vẫn ở trong $D_{h}$. Cuối cùng, vì $\mathbb{E}_{t_0,\boldsymbol{x}0}\left[1{\tau<\theta}\right]=\mathbb{P}(\tau<\theta)$ nên chúng ta có

$$H(t_0,x_0)\geq\zeta:\mathbb{P}(\tau\geq\theta)+\delta:\mathbb{P}(\tau<\theta)+\mathbb{E}_{t_0,\boldsymbol{x}_0}\left[G(\boldsymbol{X}_\tau)\boldsymbol{1}_{\tau<\theta}+H(\theta:,:\boldsymbol{X}_\theta)\boldsymbol{1}_{\tau\geq\theta}\right]:.$$

Do tính tùy ý của $\tau\in\mathcal{T}_{[t,T]}$ và thực tế là các hằng số được thêm vào kỳ vọng ở trên là dương, chúng ta đi đến một mâu thuẫn với DPP (5.46) và bằng chứng đã hoàn tất.

Hàm xấp xỉ $\psi_{\varepsilon}$ trong phần thứ hai của chứng minh trên có thể được xem như một phép xấp xỉ bán liên tục trên của hàm giá trị, và phương pháp giải độ nhớt sử dụng nhiều cả bao bán liên tục trên và dưới của hàm giá trị khi nó không đủ trơn để phân biệt. Chúng tôi không đi sâu vào các thảo luận này ở đây, mà thay vào đó, xin giới thiệu độc giả quan tâm đến các chuyên khảo xuất sắc của Touzi (2013) cũng như Pham (2010) và Fleming & Soner (2006). Cần xem xét sơ qua cách diễn giải bất đẳng thức biến phân.

xuất hiện ở trên, được lặp lại ở đây để thuận tiện

$$\max\left{\begin{array}{c}\partial_tH+\mathcal{L}_tH:,:GH\\end{array}\right}=0:,\quad\mathrm{on}\quad\mathcal{D}:.$$

Điều này thực sự thể hiện hai khả năng: hoặc chúng ta có

$$\mathrm{(i)}\quad\partial_tH+\mathcal{L}_tH=0\quad\mathrm{và}\quad H<G:,$$

hoặc chúng ta có

$$H=G\quad\mathrm{và}\quad\partial_{t}H+\mathcal{L}_{t}H<0:.$$ (ii)

Khả năng đầu tiên trong số những khả năng này tương ứng với hàm giá trị $H$ thấp hơn phần thưởng $G$ và trong vùng này, hàm giá trị thỏa mãn PDE tuyến tính. Nếu chúng ta giới thiệu quá trình ngẫu nhiên $h_{t}=H(t,\boldsymbol{X}{t})$ , thì do PDE tuyến tính có vế phải bằng 0, $ht$ là một martingale. Vùng mà (i) xảy ra là vùng mà chúng ta đã xác định trước đó là vùng tiếp tục $S^{c}$ , vì dừng lại ở đó là không tối ưu. Khả năng thứ hai trong số những khả năng này tương ứng với hàm giá trị $H$ bằng với phần thưởng $G$ , và do đó xảy ra trong vùng dừng $\delta$ . Hơn nữa, toán tử tuyến tính $\partial{t}+\mathcal{L}{t}$ làm cho hàm giá trị âm. Trong vùng này, nếu chúng ta không ghim hàm giá trị vào phần thưởng, chúng ta thấy rằng quá trình $h{t}$ sẽ là một siêu martingale; Tuy nhiên, việc gắn nó vào phần thưởng sẽ hạn chế quá trình trở thành một martingale. Do đó, ta thấy rằng quá trình ngẫu nhiên $h_{t}$ tương ứng với dòng chảy của hàm giá trị thực chất là một martingale trên toàn bộ $\mathcal{D}$

5.6 Kết hợp dừng và kiểm soát

Có nhiều trường hợp tác nhân muốn giải quyết bài toán dừng và điều khiển tối ưu kết hợp - tức là tác nhân muốn giải đồng thời để tìm ra thời điểm và chiến lược tối ưu nhằm tối đa hóa phần thưởng. Những bài toán như vậy kế thừa các đặc điểm từ cả hai loại bài toán, và chúng ta sẽ thấy rằng các DPE kết quả thực chất là sự kết hợp của phương trình HJB và bất đẳng thức biến phân. Trong trường hợp này, chúng tôi áp dụng các giả định mô hình và ký hiệu từ tiểu mục

5.4.3 nhưng lặp lại ở đây. Trước tiên, hãy cho $N^{\boldsymbol{u}}:=:(N_{t}^{\boldsymbol{u}}){0\leq t\leq T}$ biểu thị một tập hợp các quá trình đếm (của dim $P$ ) với cường độ được kiểm soát. $\lambda^{u}=(\lambda{t}^{u}){0\leq t\leq T}$ và hãy cho $u=(\boldsymbol{u}t){0\leq t\leq T}$ biểu thị các quá trình điều khiển (của chiều 711 ). Hơn nữa, hãy cho $W=(W{t}){0\leq t\leq T}$ biểu thị một tập hợp các chuyển động Brown độc lập (của dim $TIL$ ). Tiếp theo, hãy để $X^{\mathbf{u}}=(X{t}^{\boldsymbol{u}}){0\leq t\leq T}$ biểu thị các quy trình được kiểm soát (của dim $TIIE$ sẽ xuất hiện trực tiếp trong tiêu chí hiệu suất của tác nhân. Nếu một (hoặc nhiều) quy trình đếm $N{t}^{i}$ xuất hiện trong tiêu chí hiệu suất hoặc trong sự phụ thuộc trong $\mu_{t}^{u}$ ， $\sigma_{t}^{u}$ và/hoặc $\gamma_{t}^{u}$ , được hiển thị bên dưới, thì lấy $X_{t}^{j}=N_{t}^{i}$ đối với một số $j$ tức là bao gồm nó thông qua một trong các thành phần trong $X.$ Tiếp theo, chúng ta giả định rằng các quy trình $X^{u}$ được kiểm soát thỏa mãn các SDE

$$dX_{t}^{u}=\mu_{t}^{u}:dt+\sigma_{t}^{u}:dW_{t}+\gamma_{t}^{u}:dN_{t}^{u}:.$$

Với một chút lạm dụng ký hiệu, chúng ta viết độ trôi, độ biến động và bước nhảy được kiểm soát

129

kích thước như

$$\begin{thu thập} \mu_{t}^{u} :=\mu(t,X_{t}^{u},u_{t}):, \left(m\times1:\mathrm{vector}\right), \\ \sigma_{t}^{u} :=\sigma(t,X_{t}^{u},u_{t}):, (m\times m:\mathrm{matrix}):, \\ \gamma_{t}^{u} :=\gamma(t,X_{t}^{u},u_{t}):, (m\times p\mathrm{~matrix}):. \end{thu thập}$$

Hơn nữa, chúng tôi giả định rằng cường độ được kiểm soát có dạng

$$\lambda_t^u:=\lambda\left(t,X_t^u,u_t\right):.$$

Phương pháp mô hình hóa ở trên ngụ ý rằng tác nhân có thể kiểm soát, nói chung, độ trôi, độ biến động, kích thước bước nhảy và số lần nhảy đến. Mức độ kiểm soát chính xác của tác nhân phụ thuộc vào dạng cụ thể của các hàm khác nhau xuất hiện trong (5.52b) 5.52c5.52d và 5.52e.

Tiếp theo, tiêu chí hiệu suất của tác nhân đối với một điều khiển được chấp nhận $u$ và thời gian dừng được chấp nhận $J$ được đưa ra bởi

$$H^{u,\tau}(t,x)=\mathbb{E}_{t,x}\left[:G\left(X_{\tau}^{u}\right):\right]:,$$

và hàm giá trị của cô ấy là

$$H(t,\boldsymbol{x})=\sup\limits_{\tau\in\mathcal{T}_{[t,T]}}\sup\limits_{u\in\mathcal{A}_{[t,T]}}H^{\boldsymbol{u},\tau}(t,\boldsymbol{x}):.$$

Theo cách này, tác nhân chọn một quy tắc dừng, tìm kiếm chiến lược tốt nhất, rồi chọn quy tắc dừng mang lại hiệu suất tổng thể tốt nhất. Như vậy, tác nhân đang hướng đến việc quyết định nên dừng *ngay bây giờ' và nhận phần thưởng tại điểm trong không gian trạng thái mà chiến lược đã đưa cô ấy đến, hay chờ đợi và tiếp tục kiểm soát quá trình với hy vọng nhận được phần thưởng tốt hơn sau này.

DPP vẫn được áp dụng trong bối cảnh hiện tại; tuy nhiên, giờ đây chúng ta phải quan tâm đến cả việc dừng và kiểm soát tối ưu. Dựa trên các lập luận tương tự như trong các phần trước, chúng ta đi đến DPP sau.

ĐỊNH LÝ 5.7 Nguyên lý quy hoạch động cho việc dừng và điều khiển tối ưu. Hàm giá trị (5.53) thỏa mãn DPP

$$\overline{H(t,x)=\sup_{\tau\in\mathcal{T}_{[t,T]}}\sup_{u\in\mathcal{A}_{[t,T]}}\mathbb{E}_{t,x}\left[G(X_{\tau}^{\boldsymbol{u}}):\mathbb{1}_{\tau<\theta}+H(\theta,X_{\theta}^{\boldsymbol{u}}):\mathbb{1}_{\tau\geq\theta}\right]:,}$$

với mọi $(t,\boldsymbol{x})\in[0,T]\times\mathbf{R}^{m}$ và mọi thời điểm dừng $\theta\leq T$

Trực giác ở đây tương tự như các DPP trước. Nếu việc dừng chưa xảy ra ( $\tau\geq\theta$ ), thì tác nhân sẽ nhận được hàm giá trị tại thời điểm đó, tại điểm đó trong không gian trạng thái, nơi điều khiển tối ưu đã đưa cô ấy đến. Nếu việc dừng đã xảy ra ( $\tau<\theta$ ), thì tác nhân đã nhận được phần thưởng, và giá trị của cô ấy bằng với phần thưởng tại thời điểm được trả, tại điểm đó trong không gian trạng thái mà điều khiển tối ưu đã đưa cô ấy đến. Tiếp theo, chúng ta sẽ nêu DPE phát sinh trong lớp bài toán này.

ĐỊNH LÝ 5.8 Phương trình Quy hoạch Động cho Bài toán Dừng và Điều khiển. Giả sử hàm giá trị $H(t,x)$ khả vi một lần trong $t$ và mọi đạo hàm bậc hai trong $iL$ đều là ezist, tức là $H\in C^{1,2}([0,T],\mathbf{R}^{m})$ ， và $G:\mathbb{R}^{m}\mapsto\mathbb{R}$ là liên tục. Khi đó $H$ giải bất đẳng thức gần biến phân $\langle QVI\rangle$

$$\overline{\max\left{\begin{array}{c}\partial_tH+\sup\limits_{u\in\mathcal{A}_t}\mathcal{L}_t^uH:,:GH\\end{array}\right}=0:,\quad trên\quad\mathcal{D}:,}$$

trong đó $\mathcal{D}=[0,T]\times\mathbb{R}^{m}$

Về tinh thần, điều này tương tự như bất đẳng thức biến phân (5.47) cho bài toán dừng tối ưu, nhưng giờ đây cũng bao gồm một phép tối ưu hóa cho quá trình điều khiển. Việc tối ưu hóa dẫn đến phương trình trở nên phi tuyến tính, như trong phương trình HJB (5.44), và do đó phương trình trên được gọi là bất đẳng thức bán biến phân thay vì bất đẳng thức biến phân. Một lần nữa, chúng ta có khái niệm về miền dừng $\delta$ và miền tiếp tục

$S^{c}$ , trong đó $$\mathcal{S}=\left{(t,x)\in[0,T]\times\mathbb{R}^m:::H(t,\boldsymbol{x})=G(\boldsymbol{x})\right}.$$

Sự khác biệt duy nhất là trong vùng tiếp tục $S^{c}$ ， hàm giá trị phải thỏa mãn phương trình HJB

$$\partial_{t}H+\sup_{u\in\mathcal{A}_{t}}\mathcal{L}_{t}^{u}H=0:,\quad\mathrm{on}\quad\mathcal{S}^{c}:,$$

thay vì PDE tuyến tính như trong bài toán dừng.

5.7

Tài liệu tham khảo và bài đọc chọn lọc

Merton (1971), Bertsekas & Shreve (1978), Merton (1992), Yong & Zhou (1999), Chang (2004), Fleming & Soner (2006), Oksendal & Sulem (2007), Oksendal (2010), Pham (2010), Touzi (2013)

Giao dịch thuật toán và giao dịch tần suất cao

Giới thiệu về Phần III

Trong phần này của cuốn sách, chúng ta sẽ đi sâu vào mô hình hóa các chiến lược giao dịch thuật toán. Hai chương đầu tiên đề cập đến các chiến lược thực hiện tối ưu, trong đó nhà đầu tư phải thanh lý hoặc mua một vị thế lớn trong một khoảng thời gian được chỉ định trước và giao dịch liên tục chỉ bằng các lệnh thị trường. Chương 6 đề cập đến vấn đề thực hiện cổ điển khi các giao dịch của nhà đầu tư tác động đến giá của tài sản và cũng điều chỉnh mức độ khẩn cấp mà nhà đầu tư mong muốn thực hiện chương trình. Trong Chương 7, chúng tôi phát triển ba mô hình thực hiện, trong đó nhà đầu tư: i) thực hiện chương trình thực hiện miễn là giá của tài sản không vượt quá một ranh giới quan trọng, i) kết hợp dòng lệnh vào chiến lược của mình để tận dụng các xu hướng ở mức giá trung bình do áp lực một chiều ở phía mua hoặc bán của thị trường gây ra, và i) giao dịch trong cả thị trường sáng và thị trường tối. Trong Chương 8, chúng tôi giả định rằng mục tiêu của nhà đầu tư là thực hiện một vị thế lớn.

trong một cửa sổ giao dịch, nhưng cô ấy chỉ sử dụng lệnh giới hạn hoặc sử dụng cả lệnh giới hạn và lệnh thị trường. Hơn nữa, chúng tôi trình bày các chiến lược thực hiện trong đó nhà đầu tư cũng theo dõi một lịch trình cụ thể như một phần của chương trình thanh lý. Chương 9 đề cập đến các thuật toán thực hiện nhắm mục tiêu dựa trên khối lượng

Lịch trình. Chúng tôi phát triển các chiến lược cho các nhà đầu tư muốn theo dõi tổng khối lượng giao dịch trên thị trường bằng cách nhắm mục tiêu: Phần trăm Khối lượng, Phần trăm Khối lượng Tích lũy và Giá Trung bình Khối lượng, còn được gọi là VWAP. Ba chương cuối cùng đề cập đến các chủ đề khác nhau trong giao dịch thuật toán. Chương

Hình 10 cho thấy cách các nhà tạo lập thị trường lựa chọn vị trí đặt lệnh giới hạn trong sổ lệnh. Các mô hình được phát triển xem xét cách các chiến lược phụ thuộc vào các yếu tố khác nhau, bao gồm mức độ e ngại rủi ro hàng tồn kho của nhà tạo lập thị trường, lựa chọn bất lợi và xu hướng ngắn hạn trong động lực của giá trung bình.

Cuối cùng, Chương 11 dành riêng cho chênh lệch thống kê và giao dịch theo cặp, và Chương 12 cho thấy cách thông tin về khối lượng được cung cấp trong sổ lệnh giới hạn được sử dụng để cải thiện các thuật toán thực hiện

6 Thực hiện tối ưu với giao dịch liên tục l

6.1 Giới thiệu

Một vấn đề kinh điển trong tài chính là làm thế nào một đại lý có thể bán hoặc mua một lượng lớn cổ phiếu mà vẫn giảm thiểu được những biến động giá bất lợi do chính các giao dịch của mình gây ra. Ở đây, thuật ngữ "lớn" có nghĩa là khối lượng mà đại lý muốn mua hoặc bán quá lớn để có thể thực hiện trong một giao dịch. Một cách để hình dung về một giao dịch quá lớn là so sánh nó với quy mô của một giao dịch trung bình hoặc với khối lượng được ghi trên sổ lệnh giới hạn (LOB) ở mức giá mua hoặc giá bán tốt nhất. Rõ ràng, nếu số lượng cổ phiếu mà đại lý muốn thực hiện lớn hơn đáng kể so với quy mô trung bình của một giao dịch, thì việc cố gắng thực hiện tất cả cổ phiếu trong một giao dịch có lẽ không phải là một ý tưởng hay.

Các nhà đầu tư thường xuyên tham gia thị trường với các lệnh lớn (các lệnh chiếm một phần đáng kể trong khối lượng giao dịch trung bình hàng ngày) là các nhà giao dịch tổ chức như quỹ hưu trí, quỹ đầu cơ, quỹ tương hỗ và quỹ đầu tư quốc gia. Những nhà đầu tư này thường ủy thác giao dịch của họ cho một nhà môi giới đại lý (người đại diện) hành động thay mặt họ. Người đại diện sẽ chia lệnh gốc thành các phần nhỏ hơn (đôi khi được gọi là lệnh con) và cố gắng thực hiện từng lệnh con này trong một khoảng thời gian, có tính đến sự cân bằng giữa tác động về giá (giao dịch nhanh hơn) và rủi ro về giá (mất nhiều thời gian hơn để hoàn thành tất cả các giao dịch). Ý chúng tôi muốn nói đến sự đánh đổi này như sau: hãy tưởng tượng tình huống mà người đại diện đang bán cổ phiếu. Nếu cô ấy giao dịch nhanh, thì lệnh của cô ấy sẽ đi qua phía mua của LOB và cô ấy sẽ nhận được mức giá tệ hơn cho các lệnh của mình. Ngay cả khi cô ấy chia nhỏ từng lệnh thành các phần nhỏ (để mỗi lệnh không đi theo sổ sách) và gửi chúng nhanh chóng ra thị trường, thì các nhà giao dịch khác sẽ nhận thấy lượng lệnh bán dư thừa và xáo trộn lại báo giá của họ, gây ra tác động tiêu cực trở lại đối với giá. Mặt khác, nếu cô ấy giao dịch chậm để tránh tác động giá này, cô ấy sẽ phải đối mặt với sự không chắc chắn về giá cả trong tương lai. Do đó, cô ấy phải cố gắng cân bằng hai yếu tố này. Thời gian mà đại lý dành ra để giãn cách và thực hiện các lệnh nhỏ hơn là rất quan trọng.

Khung thời gian ngắn sẽ dẫn đến giao dịch nhanh hơn (và do đó tác động đến giá nhiều hơn) và ít bất ổn về giá hơn, nhưng cũng có nhiều lý do tại sao khung thời gian giao dịch dài có thể không được mong muốn. Ví dụ, có thể quyết định bán một lượng lớn cổ phiếu vì giá cả thuận lợi, nhưng đến khi đại lý thực hiện tất cả các lệnh con, giá cổ phiếu có thể đã giảm xuống mức thấp hơn mong muốn.

cấp độ. Một lý do khác hạn chế thời gian cần thiết để bán tất cả cổ phiếu là hoạt động cụ thể này là một phần của hoạt động lớn hơn, là kết quả của việc tái cân bằng danh mục đầu tư, hoạt động này cũng đòi hỏi phải mua một số lượng lớn cổ phiếu của một công ty khác và cả hai hoạt động cần phải được hoàn thành trong khoảng thời gian gần như nhau.

Do đó, đại lý phải xây dựng một mô hình để giúp họ quyết định cách thức thanh lý hoặc mua lại cổ phiếu một cách tối ưu, với mục tiêu là giảm thiểu chi phí thực hiện giao dịch và cân bằng với rủi ro giá. Chi phí thực hiện được đo lường bằng chênh lệch giữa giá chuẩn và giá thực tế (được đo bằng giá trung bình trên mỗi cổ phiếu) mà giao dịch được hoàn tất. Quy ước của chúng tôi là khi dấu của chi phí thực hiện là dương, điều đó có nghĩa là có sự mất giá trị trong giao dịch vì giá thực tế của giao dịch thấp hơn giá chuẩn. Giá chuẩn thể hiện mức giá được thực hiện hoàn hảo trong một thị trường không có

Ma sát. Thông thường, giá trung bình của tài sản tại thời điểm lệnh được đưa ra để thực hiện giao dịch được sử dụng. Mức giá chuẩn này được gọi là giá đến, thường được coi là giá trung bình của giá chào mua tốt nhất và giá chào bán tốt nhất, tức là giá trung bình. Hơn nữa, khi giá đến là mức giá chuẩn, chi phí thực hiện được gọi là mức thiếu hụt thực hiện hoặc trượt giá, xem Almgren (2010).

6.2 Mô hình

Để đưa ra vấn đề thực hiện tối ưu, chúng tôi yêu cầu ký hiệu để mô tả số lượng cổ phiếu mà đại lý đang nắm giữ (hàng tồn kho), động lực của giá trung bình và cách các lệnh thị trường (MO) của đại lý ảnh hưởng đến giá trung bình.

Các quá trình ngẫu nhiên chính là:

。 $\nu:=:(\nu_{t}){{0\leq t\leq T}}$ là tỷ giá giao dịch, tốc độ mà tác nhân thanh lý hoặc mua lại cổ phiếu (đây cũng là biến mà tác nhân kiểm soát trong bài toán tối ưu hóa) 。 $Q^{\nu}=(Q{t}^{\nu}){{0\leq t\leq T}}$ là hàng tồn kho của tác nhân, rõ ràng bị ảnh hưởng bởi tốc độ giao dịch của cô ấy, · $S^{\nu}=(S{t}^{\nu}){{0\leq t\leq T}}$ là quá trình giá trung bình và về nguyên tắc cũng bị ảnh hưởng bởi tốc độ giao dịch của cô ấy · $\hat{S}^{\nu}=(\hat{S}{t}^{\nu}){{0\leq t\leq T}}$ tương ứng với quá trình giá mà người đại diện có thể bán hoặc mua tài sản, tức là giá thực hiện, bằng cách đi qua LOB và 。 $X^{\nu}:=:(X{t}^{\nu})_{{0\leq t\leq T}}$ là quy trình tiền mặt của người đại diện phát sinh từ chiến lược thực hiện của người đại diện.

Cho dù thanh lý hay mua lại, quy trình kiểm kê được kiểm soát của đại lý được đưa ra theo tỷ giá giao dịch của cô ấy như sau

$$dQ_t^\nu=\pm\nu_t:dt:,\quad Q_0^\nu=q:,$$

trong khi giá trung bình được cho là đáp ứng SDE

$$dS_t^\nu=\pm g(\nu_t):dt+\sigma:dW_t:,\quad S_0^\nu=S:,$$

Ở đâu

· $W=(W_{t}){{0\leq t\leq T}}$ là chuyển động Brown chuẩn và · $g:\mathbb{R}+\to\mathbb{R}_+$ biểu thị tác động giá vĩnh viễn mà hành động giao dịch của tác nhân có trên giá trung bình

Giá thực hiện đáp ứng SDE

$$\hat{S}_t^\nu=S_t^\nu\pm\left(\frac{1}{2}\Delta+f(\nu_t)\right):,\quad\hat{S}_0^\nu=\hat{S}:,$$

Ở đâu

· $f:\mathbb{R}+\to\mathbb{R}+$ biểu thị tác động giá tạm thời mà hành động giao dịch của tác nhân có đối với mức giá mà họ có thể thực hiện giao dịch và · $\Delta\geq0$ là mức chênh lệch giá mua, được coi là hằng số ở đây.

Các phương trình (6.1a, 6.1b và 6.1c) áp dụng cho cả bài toán thanh lý và mua lại, trong đó dấu hiệu thay đổi tùy thuộc vào việc bài toán là thanh lý (-) hay mua lại (+) cổ phiếu. Trên thị trường chứng khoán, giá cơ bản của tài sản (còn được gọi là

(Tài liệu này, được gọi là giá hiệu quả hoặc giá thực của tài sản, đề cập đến giá cổ phiếu phản ánh thông tin cơ bản về giá trị của công ty và thông tin này được thể hiện trong giá cổ phiếu. Trong chương này, chúng tôi giả định rằng trong giai đoạn giao dịch thực hiện tối ưu, giá cơ bản bằng với giá trung bình của tài sản. Do đó, khi thông tin mới về hiệu suất thực tế và kỳ vọng của công ty được công bố cho thị trường, giá trung bình sẽ thay đổi. Điều này được thể hiện một phần trong mô hình thông qua các bước tăng của chuyển động Brown $W$ trong (6.1b). Một yếu tố quan trọng của mô hình là cách các giao dịch của tác nhân ảnh hưởng đến giá trung bình.

Ở đây, lệnh thị trường của đại lý ảnh hưởng đến giá trung bình theo hai cách: thông qua $f(\nu_{t})$ trong (6.1c) và thông qua $g(\nu_{t})$ trong (6.1b). Các hàm này nắm bắt hai cách khác nhau mà giao dịch của đại lý ảnh hưởng đến giá trung bình.

Tại bất kỳ thời điểm nào, số lượng cổ phiếu được hiển thị và có sẵn trên thị trường ở mức giá chào mua/chào bán $S_{t}^{\nu}\pm\frac{1}{2}\Delta$ đều bị giới hạn. Một MO lớn sẽ đi theo sổ sách, do đó giá trung bình trên mỗi cổ phiếu thu được sẽ thấp hơn giá chào mua/chào bán hiện tại. Điều này được ghi lại trong mô hình của chúng tôi, vì một lệnh có kích thước $\nu dt$ sẽ đạt được giá thực hiện trên mỗi cổ phiếu là $S_{t}^{\nu}\pm\left(\frac{1}{2}:\Delta+:f(\nu)\right)$ với $f(\nu)\geq0.$ Tuy nhiên, lưu ý rằng tác động của lệnh được ghi lại bởi $f(\nu_{t})$ bị giới hạn ở giá thực hiện và không ảnh hưởng đến giá trung bình của tài sản. Trong Hình 6.1, chúng tôi hiển thị ảnh chụp nhanh LOB (bảng trên cùng bên trái) cho SMH vào tháng 10

1, 2013 lúc 1 giờ sáng, cùng với tác động giá trên mỗi cổ phiếu (bảng trên cùng bên phải) mà một MO với khối lượng giao dịch khác nhau sẽ phải đối mặt khi đi qua phía mua của LOB. Bảng dưới cùng bên trái hiển thị tác động mỗi giây từ 1 giờ sáng đến 11 giờ sáng, cũng như giá trị trung bình của các đường cong đó trong một phút (đường chấm chấm).

Hình 6.1 Minh họa cách ước tính tác động tạm thời từ ảnh chụp nhanh LOB bằng SMH vào ngày 1 tháng 10 năm 2013. Hai bảng trên cùng lúc 11:00 sáng. Bảng dưới bên trái từ 11:00 sáng đến 11:01 sáng và bảng dưới bên phải trong suốt cả ngày.

Chúng tôi cũng đưa vào một hồi quy tuyến tính (đường nét đứt) với giao điểm được đặt thành nửa độ phân tán; điều này tương ứng với một hàm tác động tuyến tính $f(\nu_{t})$, đây là mô hình đơn giản mà chúng tôi áp dụng trong chương này và cũng được sử dụng rộng rãi. Hình 6.1 minh họa rằng hàm $f(\nu_{t})$ dường như được mô tả tốt hơn bằng một quy luật lũy thừa, và mô hình có thể được mở rộng để kết hợp điều này. Chúng tôi sẽ thảo luận về phần mở rộng này trong Phần 6.7.

Lưu ý rằng hàm tác động thay đổi trong từng phút, và cùng với đó là tác động của các giao dịch có quy mô khác nhau. Hồi quy tuyến tính cung cấp một ước tính gần đúng về tác động tạm thời trong một phút đó. Bảng dưới cùng bên phải cho thấy độ dốc của mô hình tác động tuyến tính này thay đổi như thế nào trong suốt cả ngày. Chúng ta thấy rằng tác động lớn nhất có xu hướng xảy ra vào buổi sáng, sau đó tác động này tăng dần và duy trì trong suốt cả ngày, và giảm dần về cuối ngày. Mô hình này được thấy trong một số tài sản. Cách thứ hai mà việc thực hiện của tác nhân có thể ảnh hưởng đến giá trung bình là

thông qua $g(\nu_{t})$. Chúng tôi gọi đây là tác động vĩnh viễn của tỷ giá giao dịch. Nếu $g(\nu_{t})>0$ trong (6.1b) thì một giao dịch có quy mô $\nu:dt>0$ sẽ đẩy giá trung bình của tài sản lên cao. Một cách diễn giải cho giả định mô hình này là tác nhân đang giao dịch dựa trên thông tin phản ánh những thay đổi vĩnh viễn về giá trị của công ty, và những người tham gia thị trường điều chỉnh giá của họ để đáp ứng với các giao dịch của tác nhân.

Trước đó, trong Chương 4, chúng ta đã thảo luận về các mô hình tác động thị trường tuyến tính và ước tính các tham số cho nhiều cổ phiếu khác nhau, xem cụ thể tiểu mục 4.3.5. Mô hình cũng có thể được sửa đổi để kết hợp tình huống mà tác nhân

Các giao dịch tạo áp lực lên giá trung bình và sau đó áp lực này giảm dần sau khi đại lý hoàn thành mục tiêu khớp lệnh. Tuy nhiên, vì chúng ta đang tập trung vào việc đại lý khớp lệnh một khối cổ phiếu duy nhất, điều này không liên quan vì cô ấy sẽ không bao giờ nhận được bất kỳ lợi ích nào từ việc "điều chỉnh giá" sau khi ngừng giao dịch, và chúng tôi loại trừ điều này khỏi phân tích.

Để kết thúc phần mô tả mô hình, chúng ta chuyển sang quy trình tiền mặt của tác nhân, $X_{t}^{p}.$ Quy trình này thỏa mãn SDE

$$dX_t^v=\hat{S}_t^\nu:\nu_t:dt:,\quad X_0^v=x:,$$

và doanh thu dự kiến từ việc bán hàng là

$$R^{\nu}=\mathbb{E}\left[X_{T}^{\nu}\right]=\mathbb{E}\left[\int_{0}^{T}\hat{S}_{t}:\nu_{t}:dt\right]:,$$

Điều này dễ thấy nếu chúng ta xem xét doanh thu bán hàng theo các bước thời gian rời rạc. Giả sử rằng đại lý phải thanh lý $Q_{0}=90$ lượng cổ phiếu trong khoảng thời gian $[0,T]$. Bây giờ, hãy chia đường chân trời giao dịch này thành các khoảng thời gian cách đều nhau $t_{0}=0<t_{1}<t_{2}<\cdots<t_{N}=T$ trong đó $t_{n}-t_{n-1}=\Delta t$ với $n=1$ ， 2 ， ... ， $\Lambda^{\prime}$ Tiếp theo, giả sử rằng trong khoảng thời gian $[0,t_1)$, tác nhân bán $Q_{0}-Q_{t_{1}}$ cổ phiếu với giá $\hat{S}0$ và trong khoảng thời gian $[t_1,t_2)$, cô ấy bán $Q{t_{1}}-Q_{t_{2}}$ với giá $\hat{S}_{t_1}$, v.v., thì tổng doanh thu dự kiến từ việc bán cổ phiếu là

$$R_{\Delta t}^{\nu}=\mathbb{E}\left[\left(Q_0-Q_{t_1}\right)\hat{S}_0+\left(Q_{t_1}-Q_{t_2}\right)\hat{S}_{t_1}+\cdots+\left(Q_{t_{N-1}}-Q_T\right)\hat{S}_{t_{N-1}}\right]:,$$

và nhớ lại rằng tốc độ giao dịch được đưa ra bởi (6.la) chúng ta quan sát thấy rằng khi $\Delta t\rightarrow0$ chúng ta thu được (6.3)

Phần còn lại của chương này xem xét các chiến lược tối ưu khác nhau để giao dịch một khối cổ phiếu chỉ sử dụng MO, trong đó ở mỗi phần, việc thiết lập bài toán kiểm soát đưa ra các giả định khác nhau về cách tác nhân phạt và/hoặc kiểm soát hàng tồn kho và cách tỷ lệ giao dịch của cô ấy ảnh hưởng đến giá thực hiện cũng như giá trung bình của tài sản. Chúng tôi cũng xen kẽ giữa các bài toán thanh lý cổ phiếu và mua lại cổ phiếu. Trong Phần 6.3, tác nhân phải thanh lý một khối cổ phiếu và các giao dịch của tác nhân ảnh hưởng đến giá thực hiện của cô ấy nhưng không ảnh hưởng đến giá trung bình của tài sản ( $g(v)=0$ ). Việc thiết lập bài toán giả định rằng chiến lược thực hiện được thiết kế sao cho tất cả các cổ phiếu được thanh lý vào ngày kết thúc. Trong Phần 6.4, tác nhân giải quyết tỷ lệ mua lại tối ưu trong đó bất kỳ hàng tồn kho nào còn lại chưa mua có thể được mua vào ngày kết thúc nhưng phải chịu phạt (và $g(v)=0$ ). Trong Mục 6.5, đại lý phải thanh lý một khối cổ phiếu, và hành động của đại lý vừa có tác động vĩnh viễn ( $g(v)\geq0$ ) lên giá thực hiện, vừa có tác động tạm thời ( $f(v)\geq0$ ) lên giá trung bình của tài sản. Ngoài ra, chúng tôi kết hợp một tham số cho mức độ khẩn cấp của đại lý trong việc thực hiện giao dịch, thông qua việc chịu phạt rủi ro đối với hàng tồn kho trong suốt vòng đời của chiến lược.

Thanh lý không có hình phạt chỉ có tác động tạm thời

Chúng ta bắt đầu bằng cách thảo luận về cách một đại lý chỉ sử dụng MO để thanh lý tối ưu 90 cổ phiếu trong khoảng thời gian từ $t=0$ đến $T$. Chúng ta giả định rằng các giao dịch của chính đại lý không ảnh hưởng đến giá trung bình của tài sản, do đó giá trung bình của cổ phiếu giống như trong (6.1b) với $g(\nu_{t})=0$. Mặt khác, các giao dịch của đại lý có tác động tạm thời đến giá thực hiện của chính cô ấy vì các MO này đi qua LOB. Chúng ta giả định rằng tác động tạm thời là tuyến tính theo tốc độ giao dịch nên $f(\nu_{t})=k:\nu_{t}$ với $k>0$ trong (6.lc) và nhớ lại rằng tốc độ giao dịch $Vt$ là tốc độ mà đại lý kiểm soát. Để đơn giản, chúng ta giả định rằng chênh lệch giá mua-bán $\Delta=0$, hoặc tương đương, $S_{t}$ biểu thị giá mua tốt nhất. Việc đưa vào một chênh lệch khác không là một vấn đề đơn giản và chúng tôi để lại nó như một bài tập cho người đọc quan tâm. Cuối cùng, chúng tôi cũng giả định rằng tác nhân kiên quyết rằng tất cả 97 cổ phiếu đều được thanh lý vào thời điểm $I$ Mục tiêu của tác nhân là chọn tốc độ thanh lý 91 cổ phiếu

để cô ấy thu được doanh thu tối đa từ việc bán, và chiến lược của cô ấy phải đảm bảo tất cả cổ phiếu được thanh lý trước thời điểm $T$, tức là không thể đến hạn thanh toán mà không còn hàng tồn kho. Nói cách khác, đại lý muốn tìm ra, trong số tất cả các chiến lược thanh lý được chấp nhận $V$, chiến lược nào giảm thiểu chi phí thực hiện.

$$EC^\nu=\mathfrak{R}:S_0-\mathbb{E}\left[\int_0^T\hat{S}_t^\nu:\nu_t:dt\right]:,$$

tương đương với việc tối đa hóa doanh thu dự kiến từ việc bán mục tiêu 97 cổ phiếu. Do đó, hàm giá trị của tác nhân là

$$H(t,S,q)=\sup\limits_{\nu\in\mathcal{A}}\mathbb{E}_{t,S,q}\left[\int_t^T\left(S_u-k:\nu_u\right)\nu_u:du\right]:,$$

trong đó $\mathbb{E}{t,S,q}[\cdot]$ biểu thị kỳ vọng có điều kiện trên $S{t}=S$ và $Q_{t}=q$, và $A$ là tập hợp các chiến lược có thể chấp nhận được: $JF$ - các chiến lược bị chặn không âm có thể dự đoán được. Ràng buộc này loại trừ việc mua lại cổ phiếu và giữ tỷ lệ thanh lý hữu hạn. Để giải bài toán điều khiển tối ưu này, chúng tôi sử dụng nguyên lý quy hoạch động

nguyên tắc (DPP) cho thấy hàm giá trị thỏa mãn phương trình lập trình động (DPE)

$$\partial_tH+\frac{1}{2}\sigma^2:\partial_{SS}H+\sup_{\nu}\left{\left(Sk:\nu\right)\nu-\nu:\partial_qH\right}=0:.$$

Tác nhân yêu cầu chiến lược tối ưu thanh lý toàn bộ hàng tồn kho vào thời điểm $I$ do đó hàm giá trị phản ánh điều này bằng cách 'phạt' bất kỳ hàng tồn kho đầu cuối nào không bằng không, vì vậy chúng ta yêu cầu

$$H(T,S,q)\xrightarrow{t\to T}-\infty,\quad\mathrm{for}\quad q>0:,$$

Và

$$H(T,S,0)\xrightarrow{t\to T}0:.$$

Điều kiện bậc nhất áp dụng cho DPE (6.4) cho thấy nó đạt tới một supre mumat

$$\nu^*=\frac{1}{2k}\left(S-\partial_qH\right):,$$

là tốc độ giao dịch tối ưu dưới dạng điều khiển phản hồi. Khi thay thế vào DPE, ta thu được phương trình vi phân riêng phần phi tuyến tính

$$\partial_tH+\frac{1}{2}:\sigma^2:\partial_{SS}H+\frac{1}{4:k}\left(S-\partial_qH\right)^2=0$$

cho hàm giá trị.

Để đề xuất một phương án thay thế cho phương trình trên, việc xem xét các điều kiện biên sẽ hữu ích để xác định các biến nào có liên quan trong hàm giá trị. Chúng ta biết rằng nếu chiến lược đạt đến ngày kết thúc với lượng hàng tồn kho khác không, hàm giá trị phải trở nên lớn tùy ý và âm vì chiến lược tối ưu phải đảm bảo tất cả cổ phiếu đều được thanh lý. Chúng tôi đề xuất rằng hàm giá trị được viết dưới dạng giá trị sổ sách của hàng tồn kho hiện tại (được định giá theo giá thị trường, sử dụng giá trung bình làm tham chiếu) cộng với giá trị thặng dư do việc thanh lý tối ưu số cổ phiếu còn lại, tức là.

$$H(t,S,q)=q:S+h(t,q):,$$

trong đó $h(t,q)$ vẫn chưa được xác định, mặc dù chúng ta biết rằng nó phải tăng vọt khi $t$ tiến tới $I$

Theo cách đặt vấn đề, điều tốt nhất mà tác nhân có thể làm là đạt được giá trung bình. Do đó, phép hiệu chỉnh $h(t,q)$ đối với giá trị sổ sách phải âm, và mục tiêu của tác nhân là giảm thiểu sự điều chỉnh giảm này. Thay thế giả thuyết này vào DPE (6.6), ta thu được phương trình sau cho $h(t,q)$

$$\partial_th+\frac{1}{4:k}\left(\partial_qh\right)^2=0:.$$

Điều thú vị là biến động giá trung bình của tài sản không nằm trong vấn đề này. Lý do là vì thành phần Brownian là một martingale, và do đó, trung bình nó không đóng góp gì vào giá trị của cổ phiếu thanh lý.

Tập trung vào PDE phi tuyến tính ở trên cho $h$, chúng ta thấy rằng việc viết phép tách biến dưới dạng $h(t,q)=q^{2}:h_{2}(t)$ (lưu ý chỉ số 2 biểu thị rằng hàm này là hệ số của $q^2$) cho phép chúng ta phân tích $q$ ra và thu được ODE phi tuyến tính đơn giản cho $h_{2}(t)$

$$\partial_th_2+\frac{1}{k}:h_2^2=0:,$$

mà chúng ta giải quyết bằng cách tích phân giữa $t$ và 7 để thu được

$$h_2(t)=\left(\frac{1}{h_2(T)}-\frac{1}{k}(Tt)\right)^{-1}:.$$

Như đã thảo luận ở trên, chiến lược tối ưu phải đảm bảo rằng tồn kho cuối kỳ bằng không và điều này tương đương với việc yêu cầu $h_{2}(t)\to-\infty$ a8 $t\rightarrow T.$. Theo cách này, hàm giá trị sẽ phạt nặng đối với tồn kho cuối kỳ khác không. Một cách khác để đạt được điều kiện này là tính toán đường tồn kho dọc theo đường tối ưu.

chiến lược và áp đặt rằng hàng tồn kho đầu cuối bằng không. Để thấy điều này, hãy sử dụng ansatz(6.7) để giảm (6.5) tc

$$\nu_{t}^{_}=-\frac{1}{k}h_{2}(t):Q_{t}^{\nu^{_}}:,$$

sau đó tích hợp $dQ_{t}^{\nu^{}}=-\nu_{t}^{}:dt$ trên $[0,t]$ để có được hồ sơ hàng tồn kho theo chiến lược tối ưu:

$$\int_0^t\frac{dQ_t^{\nu^_}}{Q_t^{\nu^_}}=\int_0^t\frac{h_2(s)}{k}ds\quad\Rightarrow\quad Q_t^{\nu^*}=\frac{(Tt)-k/h_2(T)}{Tk/h_2(T)}\mathfrak{N}:.$$

Để thỏa mãn điều kiện tồn kho đầu cuối $Q_{T}^{\nu}=0$ và cũng đảm bảo rằng phép điều chỉnh $h(t,q)$ đối với giá trị sổ sách của các cổ phiếu đang lưu hành cần thanh lý là âm, chúng ta phải có

$$h_2(t)\to-\infty\quad\mathrm{as}\quad t\to T:.$$

Trở lại giải bài toán tối ưu, ta có

$$h_2(t)=-k\left(Tt\right)^{-1},$$

vì vậy hàng tồn kho tối ưu để nắm giữ là

$$\boxed{\quad Q_t^{\nu^*}=\left(1-\frac{t}{T}\right):\mathfrak{R}:,}$$

và tốc độ giao dịch tối ưu là

$$\boxed{\quad\nu_t^*=\frac{\mathfrak{M}}{T}:.}$$

Kết quả cuối cùng cho tốc độ giao dịch tối ưu này khá đơn giản: cổ phiếu phải được thanh lý ở mức giá không đổi và chiến lược này giống với chiến lược giá trung bình theo thời gian (TWAP)

Thu thập tối ưu với hình phạt cuối cùng và tác động tạm thời

Vấn đề bây giờ là mua (không phải thanh lý) $yt$ cổ phiếu vào thời điểm $I$, bắt đầu với $Q_{0}^{\nu}=0$. Như trong phần trước, các MO của đại lý đi qua LOB nên giá thực hiện của cô ấy được mô tả bởi (6.1c) với $f(\nu)=k\nu$ ： $k>0$ Mặc dù mục tiêu của đại lý là hoàn thành chương trình mua lại bằng

tại thời điểm ${'I}$, cô ấy cho phép các chiến lược không đạt được mục tiêu này, $Q_{T}^{\nu}<\Re$, và trong trường hợp này, cô ấy phải thực hiện lệnh mua MO cho số tiền còn lại và chịu thêm một khoản phạt. Khoản phạt tồn kho cuối kỳ này được tham số hóa bởi $\alpha>0$, bao gồm chi phí kiểm kê sổ sách tại $T$ và bất kỳ khoản phạt bổ sung nào khác mà đại lý phải chịu để thực hiện giao dịch tại ngày cuối kỳ.

Do đó, chi phí dự kiến của tác nhân từ chiến lược $Vr$ là

$$EC^{\nu}=\mathbb{E}\bigg[\underbrace{\int_{t}^{T}\hat{S}_{u}^{\nu}:\nu_{u}:du}_{\text{Tiền mặt đầu cuối}}+\underbrace{(\mathfrak{M}-Q_{T}^{\nu}):S_{T}}_{\text{Thực hiện đầu cuối ở giữa}}+\underbrace{\alpha:(\mathfrak{M}-Q_{T}^{\nu})^{2}}_{\text{Hình phạt đầu cuối}}\bigg]:.$$

So với chi phí dự kiến trong phần trước, chúng ta có thêm hai điều khoản bổ sung. Trong bài toán thanh lý ở phần trước, tác nhân tìm kiếm một chiến lược đảm bảo tất cả cổ phiếu được thanh lý bằng $T$ và chi phí dự kiến chỉ phát sinh từ giao dịch liên tục. Giờ đây, tác nhân có thể đạt $I$ thấp hơn mục tiêu, nhưng điều này tạo ra các điều khoản bổ sung bao gồm việc bán đó cộng với khoản phạt để mua số cổ phiếu còn lại vào ngày kết thúc. Để đơn giản hóa ký hiệu, chúng tôi giới thiệu một quy trình ngẫu nhiên mới $Y=(Y_{t})_{0\leq t\leq T}$

để biểu thị số cổ phiếu còn lại cần mua giữa $t$ và thời điểm kết thúc của khung thời gian giao dịch $\Upsilon$

$$Y_{t}^{\nu}=\Re-Q_{t}^{\nu}:,\quad\mathrm{so~that}\quad dY_{t}^{\nu}=-\nu_{t}:dt:,$$

và viết hàm giá trị như

$$H(t,S,y)=\inf_{\nu\in\mathcal{A}}\mathbb{E}_{t,S,y}\left[\int_{t}^{T}\hat{S}_{u}^{\nu}\nu_{u}:du+Y_{T}^{\nu}:S_{T}+\alpha:\left(Y_{T}^{\nu}\right)^{2}\right]:,$$

trong đó rõ ràng là chiến lược này nhằm mục đích giảm thiểu số tiền mặt phải trả để mua cổ phiếu.

Áp dụng DPP, chúng tôi mong đợi rằng hàm giá trị sẽ thỏa mãn DPE

$$0=\partial_tH+\frac{1}{2}\sigma^2\partial_{SS}H+\inf_{\nu}\left{\left(S+k\nu\right)\nu-\nu\partial_yH\right}:,$$

với điều kiện đầu cuối $H(T,S,y)=y:S+\alpha:y^{2}$ . Giải quyết cho các điều kiện bậc nhất, tốc độ giao dịch tối ưu ở dạng phản hồi được đưa ra bởi

$$\nu^*=\frac{1}{2k}\left(\partial_yH-S\right):,$$

và khi thay thế vào DPE ở trên, chúng ta thu được

$$\partial_tH+\frac{1}{2}\sigma^2\partial_{SS}H-\frac{1}{4k}\left(\partial_yH-S\right)^2=0:.$$

Để giải bài toán DPE này, chúng ta có thể viết hàm giá trị theo giá trị sổ sách của các tài sản còn lại cần mua và hàm giá trị thặng dư từ việc mua lại các cổ phiếu này một cách tối ưu. Từ việc xem xét điều kiện cuối cùng và cách $y$ đi vào DPE, chúng tôi đưa ra giả thuyết rằng hàm giá trị thặng dư có thể được viết theo hàm bậc hai trong $y$. Giả thuyết tương ứng là

$$H(t,S,y)=y:S+h_0(t)+h_1(t):y+h_2(t):y^2:,$$

trong đó $h_{2}(t)$ ， $h_{1}(t)$ ， $h_{0}(t)$ là các hàm xác định theo thời gian, vẫn chưa được xác định (lưu ý rằng các chỉ số dưới của các hàm biểu thị lũy thừa của $y$ nhân chúng trong phép biến đổi toàn phần). Nhớ lại rằng hàm giá trị tại ngày cuối $I$ là $H(T,S,y)=y:S+\alpha:y^{2}$, thì

$$h_2(T)=\alpha\quad\mathrm{và}\quad h_1(T)=h_0(T)=0:.$$

Hơn nữa, khi thay thế ansatz vào PDE phi tuyến tính ở trên, chúng ta thấy rằng

$$0=\begin{Bmatrix}\partial_th_2-\frac{1}{k}:h_2^2\end{Bmatrix}:y^2+\begin{Bmatrix}\partial_th_1-\frac{1}{2k}:h_2:h_1\end{Bmatrix}:y+\begin{Bmatrix}\partial_th_0-\frac{1}{4k}:h_1^2\end{Bmatrix}:.$$

Vì phương trình này phải hợp lệ với mọi $y$, nên mỗi số hạng trong dấu ngoặc nhọn phải biến mất. Điều này cung cấp cho chúng ta ba phương trình cho ba hàm $h_{0}$ ， $h_{1}$ và $h_{2}$ . Do điều kiện kết thúc $h_{1}(T)=0$ nên ta thấy nghiệm ta thu được cho $h_{1}$ (bằng cách đặt số hạng thứ hai trong ngoặc nhọn bằng 0) là $h_{1}(t)=0.$ Tương tự, do điều kiện kết thúc $h_{0}(T)=0$ nên ta thấy nghiệm ta thu được cho $h_{0}$ (bằng cách đặt số hạng thứ ba trong ngoặc nhọn bằng 0 và biết rằng $h_{1}(t)=0$ ) là $h_{0}(t)=0$ Thật vậy, ta có thể bắt đầu với phương án $H(t,S,y)=y:S+h_{2}(t):y^{2}$ và kết thúc bằng phương trình tương tự cho $h_{2}$ . Phương trình cuối cùng (thu được bằng cách đặt số hạng đầu tiên trong dấu ngoặc nhọn thành 0) cho phép chúng ta thu được $h_{2}(t)$ và trong trường hợp này, vì $h_{2}(T)=\alpha$ , chúng ta thu được nghiệm không tầm thường

$$h_2(t)=\left(\frac{1}{k}\left(Tt\right)+\frac{1}{\alpha}\right)^{-1}:.$$

Kết hợp điều này với ansatz cho hàm giá trị, chúng ta thấy rằng tốc độ giao dịch tối ưu là

$$\nu_{t}^{_}=\left((Tt)+\frac{k}{\alpha}\right)^{-1}:Y_{t}^{\nu^{_}}:.$$

Ở đây, chúng ta thấy rằng khi tham số phạt cuối cùng $\alpha\rightarrow\infty$, tốc độ mua lại hội tụ về TWAP. Tương tự, giá trị của $dx$ càng nhỏ, nếu các yếu tố khác không đổi, thì tốc độ mua lại càng chậm. Hơn nữa, trong trường hợp giới hạn $\alpha\rightarrow0$, chiến lược tối ưu là không mua bất kỳ cổ phiếu nào cho đến ngày kết thúc, tại thời điểm đó, tất cả 97 cổ phiếu đều được mua. Trong trường hợp giới hạn này, không có chi phí kiểm kê sổ sách tại ngày ${'I}$, vì vậy, tối ưu là mua toàn bộ hàng tồn kho vào cuối kỳ. Tuy nhiên, nhìn chung, chúng ta kỳ vọng rằng $\alpha\gg k$. Như trước đây, chúng ta có thể giải quyết đường dẫn tồn kho tối ưu một cách rõ ràng bằng cách tích phân

$dY_{t}^{\nu^{}}=-\nu_{t}^{}:dt$ trên $[0,t]$ , tức là bằng cách giải

$$dY_t^{\nu^_}=-\left((Tt)+\frac{k}{\alpha}\right)^{-1}Y_t^{\nu^_}:dt$$

đối với $Y_{t}^{\nu^{*}}.$ Nhớ lại rằng $Y_{t}^{\nu}=\Re-Q_{t}^{\nu}$ , thật dễ dàng để có được đường dẫn tồn kho tối ưu như

$$\boxed{\quad Q_t^{\nu^*}=\frac{t}{T+\frac{k}{\alpha}}:\mathfrak{M}:.}$$

Từ phương trình này, chúng ta có thể thấy rằng đối với bất kỳ $\alpha>0$ hữu hạn nào và $k>0$ hữu hạn, việc để lại một số cổ phiếu để thực hiện tại ngày kết thúc luôn là tối ưu và tỷ lệ cổ phiếu còn lại để thực hiện tại ngày kết thúc giảm dần theo tác động giá tương đối tại ngày kết thúc, $k/\alpha$ Để có được tốc độ mua lại tối ưu, chúng ta thay thế $Q_{t}^{\nu}$ vào

biểu thức cho $V_{t}^{*}$ , do đó

$v_t^* = \frac{\hbar}{T + \frac{k}{\alpha}}$

So sánh kết quả này với kết quả từ phần trước (xem (6.1l) và (6.12)), ta thấy rằng tác nhân thu thập với tốc độ không đổi nhưng chậm hơn so với tác nhân phạt nặng (tức là $\alpha\rightarrow\infty$) các đường dẫn không hoàn thành việc thực thi đầy đủ. Hơn nữa, tác nhân giao dịch với tốc độ không đổi và tốc độ này giống với tốc độ của tác nhân phải thực hiện mọi thứ vào cuối kỳ, nhưng có ngày kết thúc $T^{\prime}$ ở xa hơn trong tương lai, $T^{\prime}=T+\frac{k}{\alpha}$

6.5 Thanh lý với tác động giá vĩnh viễn

Trong phần này, chúng ta chuyển từ mua lại sang thanh lý. Đại lý tiếp tục chỉ sử dụng MO để thanh lý tổng cộng 90 cổ phiếu, nhưng giờ đây các giao dịch của cô ấy có cả tác động tạm thời và vĩnh viễn đến giá. Động lực giá trung bình được cho bởi (6.1b) với độ trôi $g(\nu_{t})>0$, đi vào phương trình với dấu âm vì các giao dịch bán của đại lý tạo ra áp lực giảm vĩnh viễn, và giá thực hiện bởi (6.1c) với $f(\nu_{t})>0$, đi vào phương trình với dấu âm vì các giao dịch bán có tác động bất lợi tạm thời. Ở đây, chúng tôi giả định rằng nếu chiến lược của đại lý đạt đến ngày kết thúc $T$ với hàng tồn kho còn lại, thì cô ấy phải thực hiện một MO để đạt đến 97 với tổng doanh thu là $Q_{T}^{\nu}\left(S_{T}^{\nu}-\alpha:Q_{T}^{\nu}\right)$, ， trong đó $\alpha\geq0$ là tham số phạt thanh lý cuối cùng. Mục tiêu của đại lý là giảm thiểu chi phí thực hiện

$$EC^{\nu}=\mathfrak{M}:S_{0}-\mathbb{E}\Big[\underbrace{X_{T}^{\nu}}_{\text{Tiền mặt đầu cuối}}+Q_{T}^{\nu}:(\underbrace{S_{T}^{\nu}}_{\text{Giá trung bình}}-\underbrace{\alpha Q_{T}^{\nu}}_{\text{Phạt trên mỗi cổ phiếu}})\Big]:,$$

trong đó quy trình tương ứng với giá trị tài sản của nhà đầu tư $X_{t}^{\nu}$ như trong (6.2). Ở đây, chúng ta đã chuyển từ việc viết rõ ràng quy trình tiền mặt theo chi phí thực hiện tích hợp sang bao gồm trực tiếp quy trình tiền mặt. Bằng cách này, quy trình tiền mặt trở thành một biến trạng thái. Về nguyên tắc, chúng ta có thể tiếp tục sử dụng biểu diễn chi phí tích hợp; tuy nhiên, đôi khi việc lựa chọn ansatz cho các bài toán sắp tới sẽ dễ dàng hơn khi các hàm giá trị được viết theo $X$ như một biến trạng thái. Trong phần này, chúng tôi cũng giới thiệu một yếu tố khác vào mô hình: một

Hình phạt tồn kho có dạng $\phi\int_{t}^{T}(Q_{u}^{\nu})^{2}$ với $\phi\geq0$. Hình phạt tồn kho đang chạy này không phải (và không nên được xem xét) là một chi phí tài chính cho chiến lược của đại lý. Tham số $\phi$ cho phép chúng ta kết hợp mức độ khẩn cấp của đại lý trong việc thực hiện giao dịch. Giá trị của $\phi$ càng cao, chiến lược tối ưu thanh lý cổ phiếu càng nhanh, vì nó làm tăng hình phạt cho việc thanh lý cổ phiếu muộn và khuyến khích các chiến lược ưu tiên thanh lý hàng tồn kho. Cartea, Donnelly & Jaimungal (2013) chỉ ra rằng hình phạt tồn kho đang chạy tương đương với

145

đưa ra sự ác cảm mơ hồ từ phía tác nhân, trong đó sự mơ hồ vượt quá giá trung bình, trong mô hình của họ, có thể có độ trôi ngẫu nhiên khác không. Sau đó, tiêu chí hiệu suất của tác nhân là

$$H^{\nu}(t,x,S,q)=\mathbb{E}_{t,x,S,q}\Big[\underbrace{X_{T}^{\nu}}_{\text{Tiền mặt đầu cuối}}+\underbrace{Q_{T}^{\nu}\left(S_{T}^{\nu}-\alpha:Q_{T}^{\nu}\right)}_{\text{Thực hiện đầu cuối}}-\underbrace{\phi\int_{t}^{T}(Q_{u}^{\nu})^{2}:du}_{\text{Hình phạt hàng tồn kho}}\Big]:,$$

và hàm giá trị

$$H(t,x,S,q)=\sup_{\nu\in\mathcal{A}}H^{\nu}(t,x,S,q):.$$

DPP ngụ ý rằng hàm giá trị phải thỏa mãn phương trình HJB

$$\begin{aligned}0&=\left(\partial_{t}:+\frac{1}{2}:\sigma^{2}:\partial_{SS}\right)H-\phi:q^{2}\&+\sup_{\nu}\left{\left(\nu\left(Sf(\nu)\right)\partial_{x}-g(\nu):\partial_{S}-\nu:\partial_{q}\right)H\right}:,\end{aligned}$$

tuân theo điều kiện đầu cuối $H(T,x,S,q)=x+S:q-\alpha:q^{2}$ Chúng tôi sử dụng giả định đơn giản hóa rằng giá cả tạm thời và vĩnh viễn bị ảnh hưởng

Các hàm pact là tuyến tính theo tốc độ giao dịch, tức là $f(\nu)=k\nu$ và $g(\nu)=b\nu$ đối với các hằng số hữu hạn $k\geq0$ và $b\geq0.$ Điều kiện bậc nhất cho phép chúng ta có được tốc độ giao dịch tối ưu ở dạng điều khiển phản hồi như

$$\nu^{*}=\frac{1}{2:k}\frac{(S:\partial_{\epsilon}:\frac{\partial_{\epsilon}}{E}:b:\partial_{S}-\partial_{q})H}{\partial_{x}H}:.$$

Khi thay thế điều khiển phản hồi tối ưu vào DPE, nó giảm xuống

$$0=\left(\partial_t+\frac{1}{2}\sigma^2:\partial_{SS}\right)H-\phi:q^2+\frac{1}{4:k}\frac{\left[(S:\partial_x-b:\partial_S-\partial_q)H\right]^2}{\partial_xH}:.$$

Bằng cách kiểm tra điều kiện đầu cuối $H(T,x,S,q)=x+S:q-\alpha:q^{2}$ , nó gợi ý ansatz

$$H(t,x,S,q)=x+S:q+h(t,S,q):,$$

trong đó $h$, với điều kiện kết thúc $h(T,S,q):=:-\alpha:q^{2}$, vẫn chưa được xác định. Số hạng đầu tiên của ansatz là tiền mặt tích lũy của chiến lược, số hạng thứ hai là giá trị sổ sách theo giá thị trường (ở mức giá trung bình) của hàng tồn kho còn lại, và $h$ là giá trị tăng thêm phát sinh từ việc thanh lý tối ưu số cổ phiếu còn lại. Sử dụng ansatz này trong phương trình trên và đơn giản hóa, chúng ta tìm được:

PDE phi tuyến tính cho $h$

$$0=\left(\partial_{t}+\frac{1}{2}\sigma^{2}:\partial_{SS}\right)h-\phi:q^{2}+\frac{1}{4k}\left[b\left(q+\partial_{S}h\right)+\partial_{q}h\right]^{2}:.$$

Vì PDE trên không chứa bất kỳ sự phụ thuộc rõ ràng nào vào S và điều kiện cuối cùng không phụ thuộc vào $S$ nên $\partial_{S}h(t,S,q)=0$ và ta có thể viết $h(t,S,q)=h(t,q)$ (với một chút lạm dụng ký hiệu). Phương trình sau đó được đơn giản hóa hơn nữa thành

$$0=\partial_th(t,q)-\phi:q^2+\frac{1}{4k}\left[b:q+\partial_qh(t,q)\right]^2:.$$

Hơn nữa, điều khiển tối ưu ở dạng phản hồi từ (6.22) có dạng nhỏ gọn hơn nhiều

$$\nu^*=-\frac{1}{2k}\left(\partial_qh(t,q)+b:q\right):.$$

Ở dạng này, có vẻ như giải pháp thừa nhận sự tách biệt các biến $h(t,q)=h_{2}(t):q^{2}$ trong đó $h_{2}(t)$ thỏa mãn ODE phi tuyến tính (hãy nhớ rằng chỉ số dưới 2 biểu thị rằng hàm này là hệ số của $q^{2}$

$$0=\partial_th_2-\phi+\frac{1}{k}\left[h_2+\frac{1}{2}b\right]^2:,$$

tuân theo điều kiện đầu cuối $h_{2}(T)=-\alpha.$ Phương trình vi phân này thuộc loại Riccati và có thể được tích phân chính xác. Đầu tiên, cho $h_{2}(t)=-\frac{1}{2}b+\chi(t)$ , sau đó sắp xếp lại phương trình vi phân, ta thu được

$$\frac{\partial_t\chi}{k\phi-\chi^2}=\frac1k:,$$

tuân theo $\chi(T)=\frac{1}{2}b-\alpha$ . Tiếp theo, tích phân cả hai vế của phương trình trên trên $[t,T]$ sẽ cho kết quả

$$\log\frac{\sqrt{k:\phi}+\chi(T)}{\sqrt{k:\phi}-\chi(T)}-\log\frac{\sqrt{k:\phi}+\chi(t)}{\sqrt{k:\phi}-\chi(t)}=2\gamma\left(Tt\right),$$

để có thể

$$\chi(t)=\sqrt{k:\phi}:\frac{1+\zeta:e^{2\gamma:(Tt)}}{1-\zeta:e^{2\gamma(Tt)}}:,$$

Ở đâu

$$\gamma=\sqrt{\frac{\phi}{k}}\quad\mathrm{và}\quad\zeta=\frac{\alpha-\frac{1}{2}b+\sqrt{k:\phi}}{\alpha-\frac{1}{2}b-\sqrt{k:\phi}}:.$$

Tại thời điểm này, giải pháp của DPE đã được xác định đầy đủ và tốc độ giao dịch tối ưu giờ đây có thể được thể hiện rõ ràng dưới dạng các biến trạng thái thay vì dưới dạng phản hồi. Cụ thể, từ (6.24), tốc độ giao dịch tối ưu là

$$\boxed{\quad\nu_{t}^{_}=\gamma:\frac{\zeta:e^{\gamma:(Tt)}+e^{-\gamma :(Tt)}}{\zeta:e^{\gamma:(Tt)}-e^{-\gamma:(Tt)}}:Q_{t}^{\nu^{_}}:.}$$

Điều thú vị là tốc độ giao dịch tối ưu vẫn tỷ lệ thuận với mức tồn kho hiện tại của nhà đầu tư, như chúng ta đã thấy trong các mô hình đơn giản trước đây, nhưng giờ đây hệ số tỷ lệ phụ thuộc phi tuyến tính vào thời gian. Từ biểu thức này, ta cũng có thể tính được hàng tồn kho $Q_{t}^{\nu}$ của tác nhân.

kết quả từ việc áp dụng chiến lược này. Hãy nhớ rằng hàng tồn kho của tác nhân thỏa mãn $dQ_{t}^{\nu}=-\nu_{t}:dt$, do đó

$$dQ_t^{\nu^_}=\frac{\chi(t)}{k}Q_t^{\nu^_}:dt\quad\mathrm{so~that}\quad Q_t^{\nu^*}=\Re\exp\left{\int_0^t\frac{\chi(s)}{k}:ds\right}:.$$

Để có được hàng tồn kho theo chiến lược tối ưu, trước tiên chúng ta giải tích phân

$$\begin{đã căn chỉnh} \int_{0}^{t}{\frac{\chi(s)}{k}}:ds& =\frac{1}{k}\int_{0}^{t}\sqrt{k\phi}\frac{1+\zeta e^{2\gamma(Ts)}}{1-\zeta e^{2\gamma(Ts)}}:ds \\ &=\gamma\int_{0}^{t}\frac{e^{-2\gamma(Ts)}}{e^{-2\gamma(Ts)}-\zeta}:ds+\gamma\int_{0}^{t}\frac{\zeta e^{2\gamma(Ts)}}{1-\zeta e^{2\gamma(Ts)}}:ds \\ &=\log\left(e^{-\gamma(Ts)}-\zeta e^{\gamma(Ts)}\right)\mid_{0}^{t} \\ &=\log\frac{\zeta:e^{\gamma(Tt)}-e^{-\gamma(Tt)}}{\zeta:e^{\gamma T}-e^{-\gamma T}}:, \end{đã căn chỉnh}$$

kể từ đây

$$\boxed{\quad Q_t^{\nu^*}=\frac{\zeta:e^{\gamma(Tt)}-e^{-\gamma(Tt)}}{\zeta:e^{\gamma T}-e^{-\gamma T}}:n:.}$$

Thay thế biểu thức này vào (6.27) cho phép chúng ta viết tốc độ giao dịch tối ưu như một hàm xác định đơn giản của thời gian

$$\nu_{t}^{*}=\gamma:\frac{\zeta:e^{\gamma:(Tt)}+e^{-\gamma:(Tt)}}{\zeta:e^{\gamma:T}-e^{-\gamma:T}}:\mathfrak{M}:.$$

Trong giới hạn mà hình phạt thanh lý bậc hai tiến tới vô cực, tức là khi $\alpha\rightarrow+\infty$, ta có $\zeta\rightarrow1$. Sau đó, lượng hàng tồn kho tối ưu để nắm giữ và tốc độ giao dịch tối ưu được đơn giản hóa thành

$$Q_{t}^{\nu^{*}}\xrightarrow[\alpha\to+\infty]{\sinh\left(\gamma(Tt)\right)}{\sinh\left(\gamma:T\right)}:\mathfrak{N}:,$$

Và

$$\nu_{t}^{*}\xrightarrow[\alpha\to+\infty]{}\gamma\xrightarrow[]{\cosh{(\gamma(Tt))}}{\sinh{(\gamma:T)}}:\mathfrak{M}:.$$

Cả hai biểu thức này đều độc lập với $b$. Đối với các giá trị khác của $\alpha$, mối quan hệ giữa $Ux$ và tham số tác động giá cố định $b$ phức tạp hơn và chúng ta sẽ xem xét nó sau khi xem xét một số ví dụ số.

Hình 6.2 chứa các biểu đồ về mức tồn kho theo chiến lược tối ưu cho hai mức phạt thanh lý $\alpha$ và một số mức phạt chạy $\phi$. Lưu ý rằng khi không có phạt chạy, $\phi=0$, các chiến lược là các đường thẳng và đặc biệt, với $\alpha\rightarrow\infty$, chiến lược này tương đương với chiến lược TWAP. Khi phạt chạy $\phi$ tăng lên, các đường cong giao dịch trở nên lồi hơn và chiến lược tối ưu nhằm mục đích bán nhiều tài sản hơn sớm hơn. Đây là một kết quả trực quan vì $\phi$ biểu thị tính cấp bách của tác nhân trong việc thanh lý vị thế, và do đó khi nó tăng lên, ban đầu cô ấy sẽ thanh lý nhanh hơn. Đương nhiên, khi phạt thanh lý tăng lên, hàng tồn kho cuối cùng được đẩy về 0. Như một bài tập, người ta có thể kiểm tra rằng trong giới hạn mà phạt chạy

biến mất, $\phi\rightarrow0$ , kết quả tương tự từ phần trước được phục hồi,

Hình 6.2 Hàng tồn kho của nhà đầu tư dọc theo con đường tối ưu cho các cấp độ khác nhau của

hình phạt chạy $\phi$ Các tham số mô hình còn lại là $k=10^{-3}$ ， $b=10^{-3}$

tức là

Sự tương đương giữa tác động giá vĩnh viễn và hình phạt thanh lý cuối cùng

Trong phần trước, chúng ta đã giải quyết trường hợp tổng quát khi các giao dịch của đại lý có tác động tạm thời lên giá thực hiện và tác động vĩnh viễn lên giá trung bình. Chúng ta giả định rằng hai tác động này là tuyến tính theo tốc độ giao dịch, $f(\nu)=$ $k\nu$ và $g(\nu)=b\nu$ với các hằng số $k\geq0$ và $b\geq0$. Ta thường thấy rằng $b<\xi k$ và chúng ta cũng giả định rằng tham số phạt thanh lý $\alpha\not\in\k$. Trong phần này, chúng ta thảo luận về mối quan hệ giữa tham số phạt thanh lý $\alpha$ và tham số tác động giá vĩnh viễn $b-$, việc thảo luận về các bài toán mua lại cũng rất tương tự. Cơ sở cho phân tích này xuất phát từ việc quan sát thấy rằng ở tốc độ tối ưu của

giao dịch, như được mô tả trong (6.27), tác động vĩnh viễn và hình phạt thanh lý luôn xuất hiện dưới dạng $\alpha-\frac{1}{2}b$ , xem (6.26). Điều này ngụ ý rằng trong mô hình hiện tại, trong đó tác động vĩnh viễn là tuyến tính theo tốc độ giao dịch và thanh lý hàng tồn kho đầu cuối là bậc hai, $\alpha Q_{T}^{2}$ , người ta có thể định nghĩa một tham số duy nhất $C=\alpha-\frac{1}{2}b$ (sao cho $\mathcal{C}=\chi(T)$ ) để mô tả cách cả tác động vĩnh viễn

Tác động và hình phạt thanh lý ảnh hưởng đến tốc độ giao dịch tối ưu. Rõ ràng, chúng ta không thể làm điều này đối với các biến khác trong mô hình, chẳng hạn như đối với tiền mặt thu được từ việc thanh lý cổ phiếu. Tác động của tham số tác động giá vĩnh viễn lên biến này khá khác biệt so với tác động của hình phạt thanh lý. Để thấy rõ điều này, chúng ta hãy xem xét cách thu nhập từ việc bán cổ phiếu $yt$ bị ảnh hưởng.

bằng tác động lâu dài mà các giao dịch của đại lý có trên giá trung bình. Đầu tiên, chúng ta tính toán tiền mặt cuối cùng của đại lý khi cô ấy áp dụng một chiến lược tùy ý $\nu_{t}$. Hãy nhớ rằng vị thế tiền mặt của đại lý thỏa mãn SDE

$$dX_t^\nu=(S_t^\nu-k:\nu_t):\nu_t:dt:,$$

Ở đâu

$$dS_t^\nu=-b:\nu:dt+\sigma:dW_t:,$$

và, để đơn giản, giả sử rằng $X_{0}=0$ ， $k=0$ và $S_{0}=0$ . Khi đó, doanh thu từ việc thanh lý cổ phiếu của cô ấy, bao gồm cả việc thanh lý hàng tồn kho cuối kỳ là

$$\begin{đã căn chỉnh} R^{\nu}& =\int_{0}^{T}S_{t}^{\nu}:\nu_{t}:dt+Q_{T}^{\nu}:(S_{T}^{\nu}-\alpha Q_{T}^{\nu}) \\ &=\int_{0}^{T}\left{-b\int_{0}^{t}\nu_{u}:du+\sigma:W_{t}\right}:\nu_{t}:dt+Q_{T}^{\nu}\left(S_{T}^{\nu}-\alpha:Q_{T}^{\nu}\right) \\ &=\int_{0}^{T}\left{-b\left(\mathfrak{M}-Q_{t}^{\nu}\right)+\sigma:W_{t}\right}:\nu_{t}:dt+Q_{T}^{\nu}\left(S_{T}^{\nu}-\alpha:Q_{T}^{\nu}\right) \\ &=\int_{0}^{T}\left{-b\left(\mathfrak{M}-Q_{t}^{\nu}\right)+\sigma W_{t}\right}\left(-dQ_{t}^{\nu}\right)+Q_{T}^{\nu}\left(S_{T}^{\nu}-\alpha:Q_{T}^{\nu}\right) \\ &=-b\int_{0}^{T}(\mathfrak{M}-Q_{t}^{\nu}):d(\mathfrak{M}-Q_{t}^{\nu})-\sigma\int_{0}^{T}W_{t}:dQ_{t}^{\nu}+Q_{T}^{\nu}:(S_{T}^{\nu}-\alpha:Q_{T}^{\nu}) \\ &=-\frac{1}{2}:b\left(\mathfrak{M}-Q_{T}^{\nu}\right)^{2}+Q_{T}^{\nu}\left(S_{T}^{\nu}-\alpha:Q_{T}^{\nu}\right)-\sigma\int_{0}^{T}W_{t}:dQ_{t}^{\nu}:. \end{đã căn chỉnh}$$

Sau khi biểu diễn $R^{p}$ theo cách này, ta thấy cả $Ct$ và $b$ đều xuất hiện cùng với $(Q_{T}^{\nu})^{2}$ và cả hai đều có tác dụng phạt các hàng tồn kho khác không. Tuy nhiên, nếu ta tách riêng các số hạng trong $R^{\nu}$ chịu ảnh hưởng của $\alpha$ và $b$, ta thu được

$$R^{\nu}=-\frac{1}{2}:b\left(\mathfrak{M}^{2}-2\mathfrak{M}Q_{T}^{\nu}\right)-\left(\frac{1}{2}:b+\alpha\right)\left(Q_{T}^{\nu}\right)^{2}+Q_{T}^{\nu}S_{T}^{\nu}-\sigma\int_{0}^{T}W_{t}:dQ_{t}^{\nu}:.$$

Bây giờ rõ ràng là không chỉ $Ct$ và $b$ ảnh hưởng đến quá trình doanh thu theo cách rất khác so với tốc độ giao dịch mà còn là tác động của tham số tác động giá vĩnh viễn không thể được hấp thụ vào hình phạt thanh lý.

Thật vậy, $b$ xuất hiện rõ ràng trong hàm giá trị riêng biệt với Q. Đầu tiên, lưu ý rằng $0x$ và $b$ xuất hiện cùng nhau trong $\chi(t)$ dưới dạng $c=\alpha-\frac{1}{2}b$ (thông qua $\zeta$ ).Nhưng $b$ xuất hiện riêng biệt thông qua mối quan hệ của $h_{2}(t):=:\chi(t):-:\frac{1}{2}:b$ Vì $\chi(t)$ là yếu tố quyết định chiến lược giao dịch tối ưu, chúng ta thấy rằng $E$ có thể được hấp thụ vào $\alpha$ cho mục đích của chiến lược giao dịch. Nhưng hiệu ứng này không mở rộng đến quy trình doanh thu. Chúng ta có thể thấy điều này rõ ràng nhất khi tác nhân tuân theo chiến lược tối ưu trong trường hợp giới hạn khi $\alpha\rightarrow\infty.$ Trong trường hợp giới hạn này, tác nhân sẽ hoàn tất giao dịch vào ngày kết thúc, do đó $Q_{T}^{\nu^{*}}=0$ và bất kỳ hình phạt kết thúc nào sẽ được áp dụng cho số lượng kết thúc bằng không.

Tuy nhiên, tác động của các giao dịch của đại lý lên giá trung bình sẽ hoàn toàn tích cực: mất $\frac{1}{2}b:\mathfrak{M}^{2}$

Thực hiện với Trình tối đa hóa tiện ích theo cấp số nhân

Trong các phần trước, tác nhân được xem là trung lập rủi ro theo nghĩa là cô ấy đang tối đa hóa giá trị tài sản cuối kỳ kỳ vọng (từ việc giao dịch và thanh lý tối ưu bất kỳ cổ phiếu nào còn lại khi đáo hạn). Ngoại trừ Mục 6.3, tác nhân không hoàn toàn trung lập rủi ro vì cô ấy cũng đang phạt việc nắm giữ hàng tồn kho - một hình thức né tránh rủi ro. Trong phần này, chúng tôi chứng minh rằng nếu tác nhân né tránh rủi ro với tiện ích theo cấp số nhân, thì cô ấy hành động theo cách tương tự như tác nhân trung lập rủi ro nhưng né tránh hàng tồn kho đã được nghiên cứu trong các phần trước. Chúng ta hãy xem xét tác nhân thiết lập sở thích dựa trên tiện ích kỳ vọng của

sự giàu có danh nghĩa với tiện ích theo cấp số nhân: $u(x)=-e^{-\gamma:x}$ . Tiêu chí hiệu suất của cô ấy là

$$H^{\nu}(t,x,S,q)=\mathbb{E}_{t,x,S,q}\Lớn[-\exp\Lớn{-\gamma\Lớn(X_{T}^{\nu}+:Q_{T}^{\nu}:(S_{T}^{\nu}-\alpha:Q_{T}^{\nu})\Lớn)\Lớn}\Lớn]:,$$

và hàm giá trị của cô ấy là

$$H(t,x,S,q)=\sup_{\nu\in\mathcal{A}}H^{\nu}(t,x,S,q):,$$

trong đó $S^{\nu}$ ， $Q^{\nu}$ và $X^{\nu}$ thỏa mãn, như thường lệ, các phương trình trong (6.1) và (6.2). Tài sản cuối cùng của tác nhân có hai thành phần: tiền mặt mà cô ấy đã tích lũy được từ giao dịch thông qua $X_{T}^{\nu}$ và giá trị cô ấy nhận được từ việc thanh lý bất kỳ tài sản còn lại nào vào cuối thời hạn giao dịch thông qua $Q_{T}^{\nu}\left(S_{T}^{\nu}-\alpha:Q_{T}^{\nu}\right)$, tính đến, như trước đây, tác động của việc thực hiện một giao dịch lớn. Áp dụng DPP, chúng tôi kỳ vọng rằng $H$ thỏa mãn DPE

$$0=:\left(\partial_{t}+\frac{1}{2}:\sigma^{2}:\partial_{SS}\right)H+\operatorname*{sup}_{\nu}\left{\left(\nu:\left(Sk:\nu\right)\partial_{x}-b:\nu:\partial_{S}-\nu:\partial_{q}\right)H\right}:,$$

với tình trạng cuối cùng

$$H(T,x,S,q)=-\exp{-\gamma\left(x+q\left(S-\alpha:q\right)\right)}:.$$

Điều kiện đầu cuối theo cấp số nhân cho thấy rằng chúng ta sử dụng ansatz

$$H(t,x,S,q)=-\exp{-\gamma\left(x+q:S+h(t,q)\right)}:,$$

và khi thay thế vào (6.31), chúng ta thấy rằng $h$ thỏa mãn PDE phi tuyến tính

$$0=-\gamma:h:\partial_{t}h+\frac{1}{2}:\sigma^{2}:\gamma^{2}:q^{2}:h+\sup_{\nu}\le ft{-\gamma:\nu:(Sk:\nu)+\gamma:q:b:\nu+\gamma:\nu:(S+\partial_{q}h)\right}h:,$$

tuân theo điều kiện cuối cùng $h(T,q):=:-\alpha:q^{2}$ .Vì chúng ta mong đợi rằng $h$ là số âm, do điều kiện cuối cùng, chúng ta có thể phân tích các số hạng chung $-\gamma:h$ và thu được PDE phi tuyến tính đơn giản hơn

$$0=\partial_th-\frac{1}{2}:\sigma^2:\gamma:q^2+\sup_{\nu}\left{-k:\nu^2-(q:b+\partial_qh):\nu\right}:.$$

Thật dễ dàng để có được điều khiển tối ưu $\nu^{x}$ dưới dạng phản hồi như

$$\nu^*=-\frac{1}{2:k}(q:b+\partial_qh):,$$

và khi thay thế vào (6.33), chúng ta thấy rằng $h$ giải quyết

$$0=\partial_th-\frac{1}{2}:\sigma^2:\gamma:q^2+\frac{1}{2:k}:(q:b+\partial_qh)^2:.$$

Một quan sát nữa là nếu ta coi $h$ là bậc hai trong $\Psi$, thì tất cả các số hạng trong phương trình phi tuyến tính này đều là bậc hai trong $q$, và điều kiện kết thúc cũng vậy. Do đó, ta kỳ vọng rằng $h(t,q)=h_{2}(t):q^{2}$ đối với một hàm xác định $h_{2}(t)$ nào đó với điều kiện kết thúc $h_{2}(T)=-\alpha$ vì $h(T,q)=-\alpha:q^{2}$. Chèn giả thuyết thứ hai này và phân tích $q^{2}$ ra, ta thấy rằng $h_{2}(t)$ thỏa mãn ODE phi tuyến tính $$0=\partial_th_2-\frac{1}{2}:\sigma^2:\gamma+\frac{1}{k}:(h_2+\frac{1}{2}:b)^2:.$$

So sánh (6.35) với (6.25), ta thấy hai ODE trùng nhau bất cứ khi nào $\phi=$ $\frac{1}{2}\gamma:\sigma^{2}$ , và vì các điều kiện đầu cuối giống hệt nhau, nên nghiệm của hai PDE cũng giống hệt nhau. Do đó, sử dụng các bước tương tự như cách giải (6.25), ta thấy rằng trong trường hợp một tác nhân có sở thích tiện ích theo hàm mũ, ta có

$$h_{2}(t)=\sqrt{k:\gamma:\sigma^{2}}:\frac{1+\zeta:e^{2:\xi:(Tt)}}{1-\zeta:e^{2:\xi:(Tt)}}-\frac{1}{2}:b:,$$

nơi các hằng số

$$\xi=\sqrt{\frac{\gamma:\sigma^2}{2:k}}:,\quad\mathrm{và}\quad\zeta=\frac{\alpha-\frac{1}{2}b+\sqrt{\frac{1}{2}k:\gamma:\sigma^2}}{\alpha-\frac{1}{2}b-\sqrt{\frac{1}{2}k:\gamma:\sigma^2}}:.$$

Nhớ lại rằng $h(t,q):=:q^{2}:h_{2}(t)$ và thay thế vào giải pháp trên vào (6.34), chúng ta thấy rằng tốc độ giao dịch tối ưu là

$$\boxed{\quad\nu_t^_=\xi:\frac{\zeta:e^{\xi:(Tt)}+e^{-\xi:(Tt)}}{\zeta:e^{\xi:(Tt)}-e^{-\xi:(Tt)}}:Q_t^{\nu^_}:.}$$

Chiến lược này có hình thức giống hệt với chiến lược dành cho tác nhân trung lập rủi ro nhưng có ác cảm với hàng tồn kho xuất hiện trong (6.27). Hơn nữa, các hàm giá trị cho hai bài toán (phương pháp tối đa hóa tiện ích theo hàm mũ và phương pháp trung lập rủi ro nhưng có ác cảm với hàng tồn kho) có thể được ánh xạ với nhau. Từ (6.32), ta có

$$H^{exp-util}(t,x,q,S)=-\exp\left{-\gamma(x+q:S+q^2:h_2(t))\right}:,$$

trong đó chữ số mũ $exp-util$ nhấn mạnh rằng đây là hàm tối đa hóa tiện ích theo hàm mũ. Tương tự, từ (6.23), ta có

$$H^{inv-aver}(t,x,q,S)=x+q:S+q^{2}:h_{2}(t):,$$

trong đó chữ số mũ $inv-aver$ nhấn mạnh rằng đây là dành cho những người không muốn mua hàng tồn kho

tác nhân. Vì các hàm $h_{2}$ trùng nhau khi $\phi=:\frac{1}{2}\gamma:\sigma^{2}$ , chúng ta có thể viết các hàm giá trị theo nhau như sau:

$$\begin{aligned}&\sup_{\nu\in\mathcal{A}}\mathbb{E}\bigg[:-\exp\bigg{:-\gamma\bigg(X_{T}^{\nu}:+:Q_{T}^{\nu}:(S_{T}^{\nu}-\alpha:Q_{T}^{\nu})\bigg)\bigg}\bigg]\&=-\exp\left{-\gamma\sup _{\nu\in\mathcal{A}}\mathbb{E}\left[X_{T}^{\nu}+Q_{T}^{\nu}\left(S_{T}^{\nu}-\alpha:Q_{T}^{\nu}\right)-\frac{\gamma:\sigma^{2}}{2}\int_{0}^{T}(Q_{u}^{\nu})^{2}:du\right]\right}.\end{aligned}$$

Trong các phần sau, chúng ta sẽ thấy cách tác nhân có tiện ích theo cấp số nhân có thể được ánh xạ ngược trở lại thành một tác nhân trung lập với rủi ro nhưng e ngại hàng tồn kho trong nhiều bối cảnh khác nhau. Ví dụ, trong Phần 8.3, chúng ta nghiên cứu ánh xạ khi tác nhân sử dụng LO để thanh lý, trong Phần 9.5, chúng ta sẽ thấy cách một tác nhân nhắm mục tiêu vào tỷ lệ phần trăm khối lượng kết hợp tiện ích, và trong Phần 10.3, chúng ta nghiên cứu cách e ngại rủi ro điều chỉnh hành vi của một chỉ báo thị trường.

Tác động giá tạm thời phi tuyến tính

Trong các phần trước, chúng ta đã giả định hàm tác động giá $f(\nu)$, xem (6.1c) là tuyến tính theo tốc độ giao dịch. Từ Hình 6.1, thể hiện ảnh chụp nhanh của LOB và cách một thứ tự các khối lượng khác nhau di chuyển trên sổ sách, chúng ta thấy rằng mô hình tuyến tính là một phép xấp xỉ tốt, nhưng một số nghiên cứu đã chỉ ra rằng một quy luật lũy thừa có lũy thừa nhỏ hơn một phù hợp với dữ liệu hơn. Những người khác cũng lập luận rằng do độ chính xác dự đoán cực kỳ thấp của các mô hình tác động thị trường (thường là $<5%R^{2}$), chi phí tăng thêm độ phức tạp phát sinh từ việc rời xa mô hình tuyến tính sẽ lớn hơn bất kỳ lợi ích nào từ việc mô tả tốt hơn tác động thị trường. Tuy nhiên, việc nghiên cứu cách vấn đề được sửa đổi trong trường hợp tác động giá phi tuyến tính là rất đáng giá. Để tập trung vào các tác động của tác động phi tuyến tính, chúng ta quay trở lại mô hình trung lập rủi ro

đại lý có ác cảm với hàng tồn kho thông qua hình phạt đang diễn ra như trong tất cả các phần, ngoại trừ Phần 6.6, và do đó tiêu chí hiệu suất của đại lý giống như trong (6.20) được lặp lại ở đây để thuận tiện:

$$H^{\nu}(t,x,S,q)=\mathbb{E}_{t,x,S,q}\Big[X_{T}^{\nu}+:Q_{T}^{\nu}\left(S_{T}^{\nu}-\alpha:Q_{T}^{\nu}\right)-\phi\int_{t}^{T}(Q_{u}^{\nu})^{2}:du\Big],$$

và động lực của $S^{\nu}$ ， $X^{\nu}$ và $Q^{\nu}$ cũng được lặp lại ở đây với mô hình tác động phi tuyến tính rõ ràng được viết tại chỗ:

$$\begin{đã căn chỉnh} &dS_{t}^{\nu} =-:b:\nu_{t}:dt+\sigma:dW_{t}:, \\ &dX_{t}^{\nu} =(S_{t}^{\nu}-f(\nu_{t}):):\nu_{t}:dt:, \\ &dQ_{t}^{\nu} =-\nu_{t}:dt:. \end{đã căn chỉnh}$$

Như thường lệ, DPP gợi ý rằng hàm giá trị

$$H(t,x,S,q)=\sup_{\nu\in\mathcal{A}}H^{\nu}(t,x,S,q):,$$

Hình 6.3 Biểu diễn đồ họa của phép biến đổi Legendre $F^*(y)$ của hàm $F(x)$. Điểm mà tiếp tuyến chạm trục tung là giá trị của phép biến đổi được đánh giá tại độ dốc tại điểm tiếp tuyến.

phải đáp ứng DPE

$$0=:\left(\partial_{t}+\frac{1}{2}:\sigma^{2}:\partial_{SS}\right)H-\phi:q^{2}+\sup_{\nu}\left{\left(\nu\left(Sf(\nu)\right)\partial_{x}-b:\nu:\partial_{S}-\nu:\partial_{q}\right)H\right}:,$$

với điều kiện đầu cuối $H(T,x,S,q)=x+q\left(S-\alpha:q\right)$ . Áp dụng phương pháp thông thường, $H(t,x,S,q)=x+q:S+h(t,q)$ , tách giá trị sổ sách của tiền mặt và hàng tồn kho khỏi giá trị giao dịch tối ưu của số cổ phiếu còn lại, ta có PDE phi tuyến tính sau cho $h$

$$0=\partial_th-\phi:q^2+\sup\limits_{\nu}\left{-\nu:f(\nu)-(b:q+\partial_qh):\nu\right}:,$$

với điều kiện cuối cùng $h(T,q)=-\alpha:q^{2}$

Để tiếp tục, chúng ta hãy ký hiệu $F(\nu)=\nu:f(\nu)$ và giả sử $\nu:f(\nu)$ là lồi. Điều này ngụ ý rằng chi phí ròng (và không chỉ riêng tác động giá) của giao dịch ở mức $U$ là lồi. Điều này chắc chắn đúng với mô hình tác động giá tuyến tính, trong đó $f(\nu)=k\nu$ và do đó $F(\nu)=\nu^{2}$. Nó cũng đúng với các mô hình tác động giá theo luật lũy thừa phổ biến $f(\nu)=k\nu^{\alpha}$ trong đó $a>0$. Theo giả định lồi này, số hạng cực đại trở thành

$$\sup\limits_{\nu}\left{-\nu:f(\nu)-(b:q+\partial_{q}h):\nu\right}=F^{*}\left(-(b:q+\partial_{q}h)\right):,$$

trong đó $F^{\prime*}$ là phép biến đổi Legendre của hàm $F$ được định nghĩa là

$$F^*(y)=\sup_x\left(x:yF(x)\right):.$$

Biến đổi Legendre là phép ánh xạ từ đồ thị của một hàm số sang tập hợp các tiếp tuyến của nó, và có thể được hiểu rõ nhất từ Hình 6.3. Hình vẽ cho thấy phép biến đổi Legendre $F^*(y)$ của hàm số $F$ bằng giá trị mà tiếp tuyến tại một điểm giao với trục tung, và đối số $y$ là độ dốc của hàm số tại điểm tiếp tuyến đó. Vì hàm số lồi, độ dốc tăng dần và do đó với mỗi độ dốc $y$, chỉ tồn tại một điểm có độ dốc đó. Do đó, phép ánh xạ là một-một. Ví dụ, trong mô hình tác động theo quy luật lũy thừa, chúng ta viết $f(x):=:k:x^{\alpha}$, ， và do đó

$F(x)=k:x^{1+a}$ Khi đó

$$F^*(y)=\sup_x\left(x:yk:x^{1+\alpha}\right):.$$

Hình 6.4 Ảnh hưởng của tác động phi tuyến tính lên chiến lược tối ưu trong trường hợp hàm tác động tạm thời theo quy luật lũy thừa với tham số lũy thừa α. Các tham số mô hình là $b=k=10^{-4},:\phi=10:k$ =10 $\phi=10$ $\alpha=100k$, và $T=1$

Chúng ta có thể tìm điểm tối ưu $\mathbb{L}^{*}$ từ điều kiện bậc nhất

$$yk\left(1+a\right)\left(x

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
bigint.cpp		bigint.cpp

Folders and files

Latest commit

History

Repository files navigation

ALGOR!THMIC VÀ GIAO DỊCH TẦN SỐ CAO K"(aE

GIAO DỊCH THUẬT TOÁN VÀ GIAO DỊCH TẦN SUẤT CAO

GIAO DỊCH TẦN SUẤT CAO

NHÀ XUẤT BẢN ĐẠI HỌC CAMBRIDGE

Mục lục

Bằng chứng thực nghiệm và thống kê: Hoạt động và chất lượng thị trường

Phần III Giao dịch thuật toán và giao dịch tần suất cao 13 Giới thiệu về Phần III

10 Tạo lập thị trường

Chiến lược giao dịch theo cặp và chênh lệch giá thống kê 11

Lời nói đầu

Hướng dẫn tóm tắt về nội dung

Phong cách của cuốn sách

Lời cảm ơn

Cách đọc cuốn sách này

Cấu trúc vi mô và sự kiện thực nghiệm

Giới thiệu Phần I

1 Thị trường điện tử và Sổ lệnh giới hạn

Thị trường điện tử và cách thức hoạt động của chúng

1.2 Phân loại người tham gia thị trường

Giao dịch trên thị trường điện tử. 1.3

1.3.1 Lệnh và Sàn giao dịch

1.3.2 Cấu trúc trao đổi thay thế

Đồng định vị 1.3.3

1.3.4 Các loại lệnh mở rộng

1.3.5 Phí trao đổi

1.4

Sổ lệnh giới hạn

1.5 Tài liệu tham khảo và bài đọc chọn lọc

Sơ lược về cấu trúc vi mô của 2 thị trường tài chính

2.1 Tạo lập thị trường

2.1.2 Chi phí giao dịch

2.1.3 Đo lường tính thanh khoản

2.1.4 Tạo lập thị trường bằng lệnh giới hạn

2.2 Giao dịch dựa trên lợi thế thông tin

Tạo lập thị trường với bất lợi về thông tin

2.3.1 Biến động giá

Tài liệu tham khảo và bài đọc chọn lọc

3 Bằng chứng thực nghiệm và thống kê: Giá cả và lợi nhuận

Giới thiệu 3.1

3.1.1 Dữ liệu

3.1.2 Giá tài sản hàng ngày và lợi nhuận

3.1.3 Hoạt động giao dịch hàng ngày

3.1.4 Khả năng dự đoán giá hàng ngày

3.2 Giá tài sản và lợi nhuận trong ngày

3.3 Thời gian giữa các lần đến

3.5 Bản chất phi Markovian của sự thay đổi giá

3.6 Phân mảnh thị trường

3.7 Kinh nghiệm giao dịch theo cặp

Tài liệu tham khảo và bài đọc chọn lọc

Bằng chứng thực nghiệm và thống kê: Hoạt động và chất lượng thị trường

Khối lượng và độ biến động hàng ngày

Hoạt động trong ngày

Mẫu khối lượng trong ngày

4.2.3 Mô hình giá

Giao dịch và Chất lượng Thị trường

4.3.1 Chênh lệch

Biến động

4.3.4 Tác động của giá

4.3.5 Đi bộ theo LOB và Tác động giá vĩnh viễn

Tin nhắn và Hoạt động hủy bỏ

4.5 Lệnh ẩn

4.6 Tài liệu tham khảo và bài đọc chọn lọc

Phần II

Giới thiệu Phần II

5 Kiểm soát tối ưu ngẫu nhiên và dừng lại

Giới thiệu

5.2 Ví dụ về các vấn đề kiểm soát trong tài chính

Bài toán Merton 5.2.1

5.2.2 Bài toán thanh lý tối ưu

Kiểm soát quá trình khuếch tán

Nguyên lý lập trình động

Phương trình lập trình động / Phương trình Hamilton-Jacobi-Bellman

Ví dụ: Vấn đề Merton

Xác minh

Kiểm soát quá trình đếm

5.4.1 Nguyên lý lập trình động

Packages