跳转至

笔记

Homepage Template Conflict

导言

  1. 在将主页从hugo迁移到mkdocs的过程中,我发现他们的配置文件不同config.toml and mkdocs.yml。所以理论上,可以实现基于同一个md内容的两个主页模板部署的兼容。但是当我迁移完之后,发现hugo的模板完全无法正常显示。这意味着有新添加的文件对hugo的运行产生了影响,但是我并没有察觉。

Colorful Life (TOP)

导言

每当到了人生的重要的十字路口的时候,人们总会思考想将自己的人生画成什么样子。高考完选志愿,本科毕业时是保研出国还是工作的路口时,我都觉得我对自己,对这个世界不够了解,把这个问题跳过了。但是研究生要毕业了,我总算想清楚了What i want。(虽然有点晚了,但至少我没有骗自己。

Top

导言

原本是想写些网站建设的计划(但别人关心的只是他们搜索的内容)。所以就讲讲所在的团队吧(每个人都关心自己的下一站在哪里)

Subscribe

导言

Follow学术大牛, 和阅读前沿技术博客 是科研探索的乐趣所在。

[DevLog] PLAN

导言

项目展望与机遇小结

241016

  • 可做的内容(NPU支持)
    • Pytorch官方库:torchao、torchtune、torchtitan
    • Pytorch官方特性:原生支持并行能力,Dtensor
    • Pytorch三方库
  • 困境
    • 新特性/库的代码不稳定,现在支持之后变动可能会很大
    • 由于人手和机器不足,余下的三方库很多,但是支持的必要性有待验证。客户的呼声不明,没有特别急用的库(之前适配过了)。
    • 提前跟进库的适配,如果跟进过多,会导致后续持续看护库的人员压力会很大。

Mkdocs

导言

mkdocs在今年支持了blog的基本功能,而且已经有探路者实践过了1。也是时候升级博客生成器了。

Research outline

李向阳讲座(研一)

en cn
Knowledgeable 知己知彼 Be Skeptical
Independent 自己拥有研究
Smart 透过观象看本质
Soft 三人行必有我师

科研,我们需要关注什么?

  1. 热点\痛点\盲点
  2. 有用、有桃战、可为的事情

实践

做项目的时候,一定要有测试程序跑,才能正向反馈。提高积极性,明确方向。

读论文

读论文,要多篇,提炼overview 抓住立足点,创新点和展望

Concurrent-AMAT, C-AMAT

并发式平均存储访问时间模型

APC

侧重于测量方法的研究, 给出了并发存储的测量方法和尺度。

在 APC 中, 周期是存储活动周期 (memory active cycle), 不是通用的 CPU 周期,所以 APC 也叫 APMAC( 存储活动周期平均访问数, access per memory active cycle)。

同时 APC 采用重叠 (overlapping) 的访存时间统计方法 : 在有两个或多个存储访 问同时进行时, 周期只增加一次。

HPL.dat file detailed explanation

HPL.dat

HPL.dat
HPLinpack benchmark input file
Innovative Computing Laboratory, University of Tennessee
HPL.out      output file name (if any) 输出文件名
6            device out (6=stdout,7=stderr,file)

1            # of problems sizes (N) = sqrt((Memory Size in Gbytes * 1024 * 1024 * 1024) /8) * ratio
11136         Ns 矩阵规模

1            # of NBs block sizes (64~512)In the [96,104,112,120,128, …, 256] range; the multiple of 64
96           NBs 矩阵分块方法

0            PMAP process mapping (0=Row-,1=Column-major) 选择处理器阵列是按列的排列方式还是按行的排列方式。

1            # of process grids (P x Q)
2            Ps # two-dimensional block-cyclic data distribution = amount of processes; P≤Q
2            Qs 二维处理器网格(P×Q)

16.0         threshold 阈值

1            # of panel fact # 后面是L分解的方式
2            PFACTs (0=left, 1=Crout, 2=Right)
1            # of recursive stopping criterium
4            NBMINs (>= 1)
1            # of panels in recursion
2            NDIVs
1            # of recursive panel fact.
1            RFACTs (0=left, 1=Crout, 2=Right)
1            # of broadcast
1            BCASTs (0=1rg,1=1rM,2=2rg,3=2rM,4=Lng,5=LnM)
1            # of lookahead depth
1            DEPTHs (>=0)
2            SWAP (0=bin-exch,1=long,2=mix)
64           swapping threshold
0            L1 in (0=transposed,1=no-transposed) form
0            U  in (0=transposed,1=no-transposed) form
1            Equilibration (0=no,1=yes)
8            memory alignment in double (> 0)

合适的参数参考