主页 - VnYzm的博客(第1页)


Windows上使用VTune分析PyTorchExtension调用的Cpp程序


最近在实现一个通过PyTorch Extension扩展PyTorch算子的C++算法,需要分析代码的运行瓶颈进行针对性优化。Intel VTune就是一个能从汇编级和源码级分析CPU运行瓶颈的工具。由于不明原因我没在服务器上跑通命令行版的VTune...

2024年1月1日

SpinalHDL上板过程记录


最近帮老师做一个硬件项目,使用SpinalHDL实现。实际用起来还是觉得这玩意不错,它能够抽象到“生成Verilog代码”这一层面,通过程序简化生成的逻辑,可以减少很多直接用Verilog需要编写的重复代码...

2023年11月25日

自定义CUDA实现PyTorch算子的四种简单方法


在探索新的深度学习算法的时候,我们可能会遇到PyTorch提供的算子不能满足需求的情况,这时候就需要自定义PyTorch算子,将我们的算法集成到PyTorch的工作流中。同时,为了提高运算效率...

2023年9月2日

SSH实现多跳代理


我们实验室有两台服务器,其中一台无法从外网访问,另一台设置了内网穿透。我平常在无法从外网访问的那台服务器上做实验,所以如果在实验室外要连接那台服务器就需要将设置了内网穿透的服务器作为跳板,通过两次ssh登进实验服务器...

2023年4月13日

flv重封装H264、AAC流


学校有一个网课系统,该系统的客户端是使用Silver light(一个.NET相关的技术框架,类似Flash)实现的,不支持跨平台。我对它的代码进行了分析,发现它会从服务器中接收H264格式的视频裸流和AAC格式的音频裸流...

2023年3月30日

CSP模板


CSP考试所用材料,包含宏定义、常用算法、简捷Vim配置等...

2023年2月27日

markdown测试


测试一下本博客(准确来说是Pandoc)的Markdown支持...

2022年2月25日

Ultra96V2开发板简单使用


概述 最近向老师借了一块Ultra96 V2开发板学习FPGA。之前虽然也有接触过FPGA开发板,但第一次用的是只有一个FPGA核的Artix-7开发板,用的也是最传统的流程,即写好verilog模块,调一下网表文件,然后直接烧录到FPGA中;第二次用的是Zynq系的Pynq z2开发板了,但是也是...

2022年1月29日

SpinalWorkshop实验笔记(三)


概述 本文涉及Stream、WavePlayer、UDP、Mandelbrot四个实验。实验地址 最后的这四个实验中的三个都和Stream类息息相关。Stream类最关键的是要掌握它的两个特性:需要握手和实时变化。 需要握手指的是Stream的传输数据需要其valid信号和ready信号均为真,而这...

2021年12月22日

SpinalWorkshop实验笔记(二)


概述 本文涉及Function、Apb3Decoder、Timer、BlackBoxAndClock四个实验。实验地址 内容 Function 本实验的电路分两个阶段: 识别字符串:用从Flow中获得的字符匹配参数字符串 获得数据:匹配成功后,从字符串后面获得一定量的字节构成一个整数输出 难点在于识...

2021年12月17日

关于我


前偏远小渔村边缘OIer,HUST计院普通大学生,现在是ICT搬砖工。

Github Gitee上也有同名账户,同步大部分项目。

我的博客园 也是我的博客,有过去的一些文章以及细致的文章分类。

联系方式:eXpteXptOTlAb3V0bG9vay5jb20=