倍福文学

手机浏览器扫描二维码访问

第761章 CUDA决赛(第1页)

有做空的必然也有承接盘,特别是像课程表这类大盘股,除了部分做空机构会做多对冲风险外,还有国家队、大机构以及一些券商们,都在趁着做空机构发布看空的时候,悄悄吸筹。

这也导致了课程表股价在200元左右反复拉扯,一会跌破了200港元,一会又被做多的拉到了210。

总之这场突如其来的金融暗战,课程表团队沦为了看客,或者说并未主动参与其中。

3月14日-15日,人大选举产生了新一届的国家领导班子。

随着新一届领导班子的诞生,此届人大会议也渐渐进入了尾声。

与此同时,申城交大那边的CUDA决赛个人赛也已经结束,只剩下最后一组团队赛还未进行评审。

“今天已经有了两组选择了量化交易,看来你们对这个领域是非常看好啊”

张明拿起话筒,笑呵呵说道。

从上午的个人赛到下午的团队赛,整整一天,他也见识到了不少技术高手。

特别是团队赛这边,除了之前的两组选择了量化交易系统外,还有团队做出了跨境金融数据实时并行分析与风险预警系统。

这都还能理解,毕竟金融领域对于计算的需求一直都比较旺盛,而当看到计算机与医学结合的CT影像系统时,还是超出了他的预期。

他根本就没想到学生团队能把GPUDirect技术与医疗重建算法融合得这么成熟,这完全达到了商用级。

看来这次大赛还真是炸出了不少牛人了。

崔天意团队将提交物上交,包含了系统完整可运行原型、技术白皮书、性能检测报告以及1年历史数据回测报告和商业白皮书。

随着CUDA组委会的工作人员开始针对系统进行技术测试,重点检查超高频行情优化。

“你的技术白皮书上说可以支持45万笔秒的行情处理?”

“是的,老师”

“是最高承压45万?还是说稳定支持这个数?”

张明继续问道。

“稳定运行40万笔秒,高并发处理可以达到45万笔秒”

崔天意回道。

“今天关于量化交易这块,你们的数据是最高的,请问你们的系统如何基于CUDA5实现45万笔秒的高并发处理?相比CPU集群,GPU优化的核心突破点在哪里?”

“核心通过三层CUDA优化实现高并发”

他沉思数秒,开始作答。

“一是利用动态并行技术,主内核根据行情类型自主启动子内核,如套利策略子内核、数据清洗子内核,无需CPU调度,减少上下文切换耗时”

“二是针对Fermi架构优化线程布局,线程块设为256,适配32线程warp特性,共享内存按数据类型分区缓存,避免bankconflict,内存带宽利用率提升至78%”

“三是通过GPU流,实现数据预处理与策略计算异步并行,隐藏数据传输延迟”

“突破点呢?”

张明记录下选手的回答,接着问道。

这个问题比较简单,崔天意只是略做思考,便给出了答案。

“相比CPU集群,核心突破点在单节点效率”

“CPU集群依赖节点间通信,延迟高且易出现负载不均,而我们的双GPU协同方案,可以通过CUDAMemcpyPeer实现GPU间直接数据传输,单节点处理能力达CPU集群8节点水平,且硬件成本仅为其13”

“FermiM2090GPU显存仅4GB,如何支撑45万笔秒行情的实时存储与计算,又避免显存溢出?”

“我们采用三级内存分层管理方案解决显存瓶颈”

崔天意思路片刻,继续答道。

“首先是常量内存存储策略参数,如套利阈值、VAR系数,这些不会超过128MB”

“其次是共享内存缓存高频访问的行情数据,单线程块分配32KB,总占用不超过2GB”

热门小说推荐
不知仙下

不知仙下

优质精品图书推荐...

父子关系+番外

父子关系+番外

附本作品来自互联网本人不做任何负责内容版权归作者所有 1 顶着两只满是血丝的熊猫眼,张景言一口喝下杯中余下的咖啡,两眼无神地看着眼前的电脑。 哇!好大的黑眼圈,昨晚干什么了? 一大早就被他吓一跳的同事平复了心跳后拿着早餐狼吞虎咽地吃着,一边口齿不清地问他。 还能干什么,加了一个晚上的班。 他已经...

卿本网瘾少女[电竞]

卿本网瘾少女[电竞]

卿本网瘾少女电竞...

千亿空间,王妃买下半壁江山

千亿空间,王妃买下半壁江山

闻溪,作为a国顶级医药大佬兵中之王,人生最大的乐趣就是敛财,获得一份藏宝图,好不容易打开宝库,谁成想竟意外穿越,只是穿越就穿越,能不能给点好的人设?穿越成一个小农女,一贫如洗不说,祖父母还身患重病,幼弟只有三岁,就要被恶毒舅舅拿去卖钱,还有一堆极品亲戚,但是好在家人疼爱,弟弟懂事,让从未感受过亲情的她誓要带这一家家致富,空间在手,天下我有,且看她如何从一届小农女变成大富,只是无意间救下的男人到底是什么来路?冰块面瘫就算了,虽然长得帅但闻溪也不图他美色,只想一心搞事业,但这人非要娶她做娘子是什么情况?本想答应,结果男人的身份竟是隐藏大佬,是否要参与到那风起云涌的斗争当中?...

每日热搜小说推荐