2023¶

2023年10月20日
分类于 OOW
需要 1 分钟阅读时间

Homepage Template Conflict

导言

在将主页从hugo迁移到mkdocs的过程中，我发现他们的配置文件不同config.toml and mkdocs.yml。所以理论上，可以实现基于同一个md内容的两个主页模板部署的兼容。但是当我迁移完之后，发现hugo的模板完全无法正常显示。这意味着有新添加的文件对hugo的运行产生了影响，但是我并没有察觉。

2023年10月18日
分类于 toLearn
需要 1 分钟阅读时间

State Owned Enterprise

导言

听师兄说国企里相对有钱点的是邮储，电网和烟草。来研究一波

2023年10月17日
分类于 Overview
需要 2 分钟阅读时间

Colorful Life (TOP)

导言

每当到了人生的重要的十字路口的时候，人们总会思考想将自己的人生画成什么样子。高考完选志愿，本科毕业时是保研出国还是工作的路口时，我都觉得我对自己，对这个世界不够了解，把这个问题跳过了。但是研究生要毕业了，我总算想清楚了What i want。（虽然有点晚了，但至少我没有骗自己。

2023年10月17日
分类于 tips
需要 4 分钟阅读时间

Top

导言

原本是想写些网站建设的计划(但别人关心的只是他们搜索的内容)。所以就讲讲所在的团队吧（每个人都关心自己的下一站在哪里）

2023年10月17日
分类于 tips
需要 1 分钟阅读时间

导言

Follow学术大牛，和阅读前沿技术博客是科研探索的乐趣所在。

2023年10月16日
分类于 ProjectRecord
需要 1 分钟阅读时间

[DevLog] PLAN

导言

项目展望与机遇小结

241016

可做的内容(NPU支持)
- Pytorch官方库：torchao、torchtune、torchtitan
- Pytorch官方特性：原生支持并行能力，Dtensor
- Pytorch三方库
困境
- 新特性/库的代码不稳定，现在支持之后变动可能会很大
- 由于人手和机器不足，余下的三方库很多，但是支持的必要性有待验证。客户的呼声不明，没有特别急用的库(之前适配过了)。
- 提前跟进库的适配，如果跟进过多，会导致后续持续看护库的人员压力会很大。

2023年10月16日
分类于 toLearn
需要 1 分钟阅读时间

Mkdocs

导言

mkdocs在今年支持了blog的基本功能，而且已经有探路者实践过了¹。也是时候升级博客生成器了。

2023年10月16日
分类于 Values
需要 1 分钟阅读时间

Research outline

李向阳讲座(研一)

en	cn
Knowledgeable	知己知彼 Be Skeptical
Independent	自己拥有研究
Smart	透过观象看本质
Soft	三人行必有我师

科研，我们需要关注什么？

热点\痛点\盲点
有用、有桃战、可为的事情

实践

做项目的时候，一定要有测试程序跑，才能正向反馈。提高积极性，明确方向。

读论文

读论文，要多篇，提炼overview 抓住立足点，创新点和展望

2023年10月16日
分类于 Algorithms
需要 1 分钟阅读时间

Concurrent-AMAT, C-AMAT

并发式平均存储访问时间模型

APC

侧重于测量方法的研究，给出了并发存储的测量方法和尺度。

在 APC 中，周期是存储活动周期 (memory active cycle)，不是通用的 CPU 周期，所以 APC 也叫 APMAC（存储活动周期平均访问数， access per memory active cycle）。

同时 APC 采用重叠 (overlapping) 的访存时间统计方法：在有两个或多个存储访问同时进行时，周期只增加一次。

2023年10月16日
分类于 Algorithms
需要 2 分钟阅读时间

HPL.dat file detailed explanation

HPL.dat

HPLinpack benchmark input file
Innovative Computing Laboratory, University of Tennessee
HPL.out      output file name (if any) 输出文件名
6            device out (6=stdout,7=stderr,file)

1            # of problems sizes (N) = sqrt((Memory Size in Gbytes * 1024 * 1024 * 1024) /8) * ratio
11136         Ns 矩阵规模

1            # of NBs block sizes (64~512)In the [96,104,112,120,128, …, 256] range; the multiple of 64
96           NBs 矩阵分块方法

0            PMAP process mapping (0=Row-,1=Column-major) 选择处理器阵列是按列的排列方式还是按行的排列方式。

1            # of process grids (P x Q)
2            Ps # two-dimensional block-cyclic data distribution = amount of processes; P≤Q
2            Qs 二维处理器网格（P×Q）

16.0         threshold 阈值

1            # of panel fact # 后面是L分解的方式
2            PFACTs (0=left, 1=Crout, 2=Right)
1            # of recursive stopping criterium
4            NBMINs (>= 1)
1            # of panels in recursion
2            NDIVs
1            # of recursive panel fact.
1            RFACTs (0=left, 1=Crout, 2=Right)
1            # of broadcast
1            BCASTs (0=1rg,1=1rM,2=2rg,3=2rM,4=Lng,5=LnM)
1            # of lookahead depth
1            DEPTHs (>=0)
2            SWAP (0=bin-exch,1=long,2=mix)
64           swapping threshold
0            L1 in (0=transposed,1=no-transposed) form
0            U  in (0=transposed,1=no-transposed) form
1            Equilibration (0=no,1=yes)
8            memory alignment in double (> 0)

合适的参数参考