百亿量化私募核心岗位 技术笔试真题 + 实盘答辩题库
一、量化策略研究员(Alpha / 高频 / CTA)
技术笔试真题
- 因子挖掘题:给定沪深 300 成分股近 5 年的日频行情数据(开盘价、收盘价、成交量、换手率),要求构建 1 个基本面因子 + 1 个量价因子,完成因子 IC 分析、分层回测、中性化处理,并说明因子衰减周期和适用场景。
- 策略实现题:用 Python 编写一个基于均线交叉(5 日均线 + 20 日均线)的趋势策略,需包含仓位管理、止损止盈逻辑,输出策略年化收益、夏普比率、最大回撤,并分析策略在震荡市的表现缺陷。
- 高频策略题:简述订单流交易的核心逻辑,如何利用盘口挂单数据识别市场冲击成本?请设计一个基于 Tick 数据的做市策略,说明价差设定和库存管理的关键参数。
实盘答辩题库
- 请介绍你过往最成功的一个实盘策略,包括策略逻辑、因子来源、回测区间、实盘业绩(年化 / 夏普 / 回撤),以及策略在极端行情(如 2022 年 4 月、2023 年 8 月)的表现和应对调整措施。
- 你如何判断一个因子的有效性和可持续性?如果因子出现衰减,你会从哪些维度进行优化?请举例说明。
- 量化策略的容量上限由什么决定?你负责的策略当前容量是多少?如何提升策略容量同时不降低收益?
二、量化开发工程师(QD / 低延时)
技术笔试真题
- C++ 基础题:编写一个线程安全的订单薄(Order Book)类,支持添加订单、撤销订单、查询最优买卖价功能,要求时间复杂度不高于 O (logN),并说明如何避免内存泄漏。
- 低延时优化题:列举 5 种降低 Linux 系统下高频交易系统延迟的方法(从内核、网络、编译三个维度),并解释每个方法的原理。
- 回测系统题:简述事件驱动回测系统和向量回测系统的区别,各自的适用场景是什么?如何解决回测中的幸存者偏差和前视偏差?
实盘答辩题库
- 请介绍你参与开发的低延时交易系统架构,包括行情接收模块、策略执行模块、风控模块的交互逻辑,系统的平均延迟是多少?如何进一步降低延迟?
- 你在开发过程中遇到过的最棘手的技术问题是什么(如并发冲突、行情丢包)?如何定位和解决的?
- 量化交易系统的稳定性和低延时哪个更重要?如何在两者之间做权衡?请举例说明你做过的稳定性优化措施。
三、AI / 深度学习研究员(AGI 方向)
技术笔试真题
- 模型搭建题:用 PyTorch 搭建一个基于 Transformer 的股票价格预测模型,输入为过去 60 个交易日的量价数据,输出为次日涨跌幅,要求包含数据预处理、模型训练、验证集调参的完整代码逻辑。
- 特征工程题:如何将文本数据(如财报、新闻、研报)融入量化策略?请设计一个基于 BERT 的文本情感因子,并说明因子有效性的验证方法。
- 强化学习题:简述强化学习在量化交易中的应用逻辑,Actor-Critic 算法相比 DQN 算法在策略优化中有什么优势?如何解决强化学习训练中的样本相关性问题?
实盘答辩题库
- 请介绍你将大模型应用于量化策略的落地案例,包括模型选型、数据来源、训练流程、实盘效果,以及相比传统量化策略的优势和不足。
- 大模型在量化投资中面临的最大挑战是什么(如过拟合、可解释性)?你是如何解决的?
- 如何评估一个 AI 量化策略的泛化能力?在不同市场环境(牛 / 熊 / 震荡)下,你会如何调整模型参数?
四、量化交易员(高频/做市)
技术笔试真题
- 做市策略题:假设你是某 ETF 的做市商,当前买卖盘口为买 1 3.00 元(1000 手)、卖 1 3.01 元(1000 手),请设计你的报价策略和库存管理规则,说明如何平衡买卖价差、成交量和库存风险。
- 交易所规则题:简述 A 股科创板做市商的资格要求和义务,做市过程中需要遵守哪些风控指标?如果触发价格波动限制,应该如何应对?
- 套利题:请计算沪深 300ETF(510300)和沪深 300 股指期货(IF2403)的期现套利成本,包括交易手续费、冲击成本、资金成本,并说明套利的触发条件和风险点。
实盘答辩题库
- 请介绍你过往的做市 / 高频交易业绩,包括日均成交量、滑点控制、胜率、最大连续亏损天数,你是如何优化报价策略来提升业绩的?
- 做市过程中遇到的最大风险是什么(如库存积压、突发行情)?请举例说明你是如何应对的?
- 如何判断一个品种是否适合做市?你会从哪些维度筛选做市标的?
五、量化风控经理(Risk Quant)
技术笔试真题
- 风险模型题:请计算一个投资组合的 VaR 值(置信水平 95%,持有期 1 天),给定组合近 1000 个交易日的日收益率数据,要求分别用历史模拟法和参数法计算,并对比两种方法的优缺点。
- 合规风控题:简述私募基金的风控指标要求(如杠杆率、集中度、回撤限制),如何设计一套实时监控系统来预警违规风险?
- 压力测试题:请设计针对股票量化组合的压力测试场景(至少 3 个),包括场景定义、冲击幅度、测试流程,并说明如何根据测试结果调整组合。
实盘答辩题库
- 请介绍你搭建的百亿级量化组合风控体系,包括事前风控(策略准入)、事中风控(实时监控)、事后风控(归因分析)的具体措施,该体系在极端行情下的表现如何?
- 如何识别量化策略的潜在风险(如因子拥挤、过拟合)?请举例说明你是如何通过风控手段限制这类风险的?
- 风控部门和策略部门之间如何平衡?当策略部门的需求与风控规则冲突时,你会如何处理?
六、数据工程师(Data Infra)
技术笔试真题
- 大数据处理题:用 Spark 编写一个 ETL 任务,处理 A 股市场的日频行情数据,要求完成数据清洗(缺失值、异常值处理)、数据转换(计算收益率、换手率)、数据入库(Hive),并优化任务的执行效率。
- 数据仓库题:请设计量化投资数据仓库的分层架构(ODS、DWD、DWS、ADS),说明每层的作用和数据模型设计原则,如何保证数据的一致性和时效性?
- 实时数据题:简述 Flink 在量化实时行情处理中的应用,如何解决实时数据处理中的乱序问题?如何保证数据处理的低延迟和高吞吐?
实盘答辩题库
- 请介绍你处理 PB 级金融数据的经验,包括数据存储方案、计算资源调度、性能优化措施,如何满足量化策略对数据时效性的要求?
- 量化策略研发对数据的核心需求是什么?你是如何与策略团队协作,提升数据服务的质量和效率的?
- 金融数据的安全性和合规性要求有哪些?你是如何确保数据处理过程符合监管要求的?