20250827 星期三

这是一个副标题

正文测试

而这些并不是完全重要,更加重要的问题是, 带着这些问题,我们来审视一下学生会退会。 既然如何, 对我个人而言,学生会退会不仅仅是一个重大的事件,还可能会改变我的人生。 我们不得不面对一个非常尴尬的事实,那就是, 可是,即使是这样,学生会退会的出现仍然代表了一定的意义。 学生会退会,发生了会如何,不发生又会如何。 经过上述讨论, 生活中,若学生会退会出现了,我们就不得不考虑它出现了的事实。 学生会退会,到底应该如何实现。 这样看来, 在这种困难的抉择下,本人思来想去,寝食难安。 对我个人而言,学生会退会不仅仅是一个重大的事件,还可能会改变我的人生。 就我个人来说,学生会退会对我的意义,不能不说非常重大。 莎士比亚曾经提到过,人的一生是短的,但如果卑劣地过这一生,就太长了。这似乎解答了我的疑惑。 莫扎特说过一句富有哲理的话,谁和我一样用功,谁就会和我一样成功。这启发了我, 对我个人而言,学生会退会不仅仅是一个重大的事件,还可能会改变我的人生。 学生会退会,到底应该如何实现。 一般来说, 从这个角度来看, 这种事实对本人来说意义重大,相信对这个世界也是有一定意义的。 在这种困难的抉择下,本人思来想去,寝食难安。 了解清楚学生会退会到底是一种怎么样的存在,是解决一切问题的关键。 一般来说, 生活中,若学生会退会出现了,我们就不得不考虑它出现了的事实。 问题的关键究竟为何? 而这些并不是完全重要,更加重要的问题是。

奥斯特洛夫斯基曾经说过,共同的事业,共同的斗争,可以使人们产生忍受一切的力量。 带着这句话,我们还要更加慎重的审视这个问题: 一般来讲,我们都必须务必慎重的考虑考虑。 既然如此, 这种事实对本人来说意义重大,相信对这个世界也是有一定意义的。 带着这些问题,我们来审视一下学生会退会。 我认为, 我认为, 在这种困难的抉择下,本人思来想去,寝食难安。 问题的关键究竟为何? 每个人都不得不面对这些问题。 在面对这种问题时, 要想清楚,学生会退会,到底是一种怎么样的存在。 我认为, 既然如此, 每个人都不得不面对这些问题。 在面对这种问题时, 那么, 我认为, 学生会退会因何而发生。

引用

思念是最暖的忧伤像一双翅膀
让我停不了飞不远在过往游荡
不告而别的你 就算为了我着想
这么沉痛的呵护 我怎么能翱翔

最暖的憂傷 - 田馥甄

图片

Photo by Florian Klauer on Unsplash Photo by Luca Bravo on Unsplash

Photo by Helena Hertz on Unsplash Photo by Hudai Gayiran on Unsplash

1
2
3
![Photo by Florian Klauer on Unsplash](florian-klauer-nptLmg6jqDo-unsplash.jpg)  ![Photo by Luca Bravo on Unsplash](luca-bravo-alS7ewQ41M8-unsplash.jpg) 

![Photo by Helena Hertz on Unsplash](helena-hertz-wWZzXlDpMog-unsplash.jpg)  ![Photo by Hudai Gayiran on Unsplash](hudai-gayiran-3Od_VKcDEAA-unsplash.jpg)

相册语法来自 Typlog

Licensed under CC BY-NC-SA 4.0
用代码记录生活,用文字温暖世界
使用 Hugo 构建
主题 StackJimmy 设计
构对蛋白质聚类 → 发现具备新功能的脱氨酶 → 应用于基因编辑。

术语 解释
Deaminase(脱氨酶) 一类催化核苷酸脱氨反应的酶,能改变 DNA/RNA 中的碱基
AlphaFold2 DeepMind 开发的 AI 工具,可以从蛋白质序列预测出其三维结构
Base Editing(碱基编辑) 一种不切断 DNA 链的精准基因编辑技术,常用于 C→T 或 A→G 碱基替换
ssDNA / dsDNA 单链DNA / 双链DNA
CBE(Cytosine Base Editor) 细胞内把 C 转换为 T 的编辑系统,通常由脱氨酶 + Cas9 组成
AAV(腺相关病毒) 常用的基因治疗载体,用于把 DNA 运送到细胞内
Clade(进化支系) 指具有共同祖先的一组蛋白质
TM-score 评估蛋白质结构相似度的指标(类似于结构的“相似度打分”)

1. 首次大规模用 AlphaFold2 做结构聚类

2. 发现了一大批新功能的脱氨酶

3. 开发了可以打包进单个病毒载体(AAV)的精简CBE

4. 解决了大豆中 CBE 编辑效率低的问题

5. 技术路线

1
蛋白质序列 → AlphaFold2 → 3D结构预测 → 聚类(结构相似性) → 实验验证功能 → 新CBE设计

6. 用了什么聚类算法?

平均链接法(Average-linkage clustering)

又称为 UPGMA(Unweighted Pair Group Method with Arithmetic Mean),是一种常见的层次聚类方法。

3D结构是怎么变成聚类输入的?

输入:蛋白质氨基酸序列(来自 InterPro 数据库)

比较结构:用 TM-score 算法做结构比对

得到相似度矩阵(distance matrix)

用该矩阵作为输入,执行:

1
Average-linkage clustering(层次聚类)→ 生成结构分类树(dendrogram)

💡 输出是一个聚类树图,将蛋白质分成了 20 个结构类(clades),比传统序列聚类更有生物学意义。

可视化工具

7. TM-score是怎样计算的?

TM-score(Template Modeling Score) 是一个衡量两个蛋白质三维结构相似性的指标。

TM-score 的计算公式(简化版)

给定两个蛋白质结构 A 和 B(通常是原子坐标,比如 Cα 原子):

$$ \text{TM-score} = \max\left\{ \frac{1}{L_{\text{target}}} \sum_{i=1}^{L_{\text{align}}} \frac{1}{1 + \left(\frac{d_i}{d_0(L_{\text{target}})}\right)^2} \right\} $$

公式说明:

相比 RMSD,TM-score:

四、Decimeter Level Cooperative Direct Localization With Ising Model Approach

文献:Decimeter Level Cooperative Direct Localization With Ising Model Approach

1. 什么是 Ising 模型?

$$ E(x) = - \sum_i b_i x_i - \sum_{i,j} W_{ij} x_i x_j $$

其中:

物理意义:系统会倾向于寻找使能量最小的配置。

数学意义:这是一个二值优化问题(binary optimization)。

2. 为什么能用 Ising 模型建模定位问题?

在论文里,定位被转化为 稀疏重建问题

这个优化目标(最小化 $\ell_0$ 范数 + 拟合误差)可以写成一个 二次二值优化问题

把这些项整理后,恰好符合 Ising 模型的能量形式,所以,定位问题就能转化为 Ising 优化问题。

3. 为什么 $\ell_1$ 范数会引入偏差?

问题

$\ell_0$ 只管“有无”,不管幅度大小,所以不会有这种系统性偏差。

4. 什么是 QUBO 问题?

$$ \min_{x \in \{0,1\}^n} x^T Q x $$

5. 怎样用 MCMC 和 DA 高效求解?

  1. MCMC(马尔科夫链蒙特卡洛)

  2. DA(Digital Annealer, 富士通的数字退火器)

6. 批注

1.

The idea of direct localization was first developed in [20]. In that work, the authors proposed a one-step direct localization approach based on estimating the eigenstructure of the spectral density matrix of the received signal.

基于密度矩阵可以哦。

2.

This paper proposes a novel direct localization method by co-processing the received signal at all antenna arrays. To coprocess data, we take advantage of the fact that LoS path from the mobile user to all of the antenna arrays originates from a common location in the area. Nevertheless, non-LoS (NLoS) paths are caused by reflection from different objects in the environment, making them to have a random nature. In other words, when we grid the area, the strongest signal received at all the antenna arrays comes from one of the grid points. Taking this fact into account, the localization problem can be formulated as a sparse support recovery problem. Therefore, we employ a compressed sensing framework for our direct localization approach which is an NP-hard optimization problem. As mentioned before, l1-norm relaxation is generally used to make this problem tractable which results in inherent bias to the solution. However, recently, authors of [46] proposed that under some conditions, binary approximation for l0-norm optimization problems leads to optimal support. In addition, although the binary approximation is still NPhard, there exists efficient binary programming solvers such as branch-and-bound methods and annealing-based methods.

为什么这个过程是NP-hard的?难道0和1的阈值难以选取么?是因为LoS和NLoS难以区分,对吧?

3. 这是一维Ising问题还是二维Ising?为什么二维天线阵列可以用一维Ising建模?

Ising 模型在这里的形式

论文里最终把问题写成了 QUBO/Ising

$$ E(x) = - b^\top x - x^\top W x $$

其中:

注意:这里并不是物理意义上的“二维 Ising 格子”,而是一个 一维向量形式的 Ising 模型,只不过这个向量的维度等于网格点数。

为什么不是二维的?

换句话说,变量是平面网格点的一维编号,而不是保留二维的拓扑结构。

4. CRB介绍

CRB 指的是 Cramér–Rao Bound(克拉美–罗下界)。

这篇文章要解决的是 定位问题,估计的是用户的位置坐标 $(x_u, y_u)$。

5. 为什么要推CRB?

6. Model解释

信号接收模型:

每个接入点接收到的信号可以写成:

$$ y_p = \sum_{l=1}^L s_{lp} \cdot a(\theta_{lp}, r_{lp}) + n_p $$

翻译一下:

换句话说,接收信号就是:直达路径 + 一堆反射 + 噪声

LoS 的特殊性

这就是为什么联合处理信号(co-processing)有用:可以利用所有 AP 的 LoS 一致性来锁定真实位置

网格化思想

由于真实用户只在一个位置,所以在一大堆网格点中,只有极少数是“有效的”,这就是 稀疏性

7. 整体思路

把整个平面划成很多网格点;对每个接入点(AP)的天线阵列,用这些网格点生成“字典/阵列流形”;把多径下的接收信号写成“稀疏叠加”;由于所有 AP 的直达径(LoS)都来自同一个真实位置,所以各 AP 在同一个网格索引上应该同时“点亮”。于是,问题变成“找出被点亮的少数网格索引”(稀疏支撑恢复),再把它改写成 Ising/QUBO 的二值优化,用 MCMC/数字退火去解。

步骤1:网格化 + 阵列流形(字典)

步骤2:把接收信号写成“稀疏叠加”

步骤3:把联合稀疏恢复做成二值的 $\ell_0$ 模型

步骤4:为什么要“好字典”(tight frame + 结构匹配)

步骤5:把目标函数改写成 Ising/QUBO

步骤6:用 MCMC/数字退火高效求解

输出与后处理

8. 对下面这段话不理解:

“由于所有 AP 的直达径(LoS)都来自同一个真实位置,所以各 AP 在同一个网格索引上应该同时“点亮”。于是,问题变成“找出被点亮的少数网格索引”(稀疏支撑恢复),再把它改写成 Ising/QUBO 的二值优化,用 MCMC/数字退火去解”

网格化的直觉

想象你把房间地板划成很多小方格(网格点),就像围棋盘。

于是,对每个 AP 来说,它都会觉得“某个格子最符合我接收到的信号”。

LoS 的“共性”

关键在于:

所以如果你把多个 AP 的“候选格子”叠在一起,唯一在所有 AP 那里都点亮的格子,就是用户真实位置

稀疏支撑恢复

改写成 Ising/QUBO

用 MCMC / 数字退火去解

这项工作的优点和局限性:

优点:定位精度优于现在的l1方法,在高SNR下接近CRB;鲁棒性好;用DA退火硬件能高校求解。

局限性:动态场景处理不好、时间复杂度不行、各个仪器的参数(维数过大)

7. 遵循词典的构造方式(采用Ising模型求解这个问题的科学原理)

1. 什么是“词典”

在压缩感知 / 稀疏表示里,**词典(dictionary)**就是一组“原子(atoms)”,每个原子对应一种信号模式。

2. “遵循词典的构造方式”是什么意思?

论文引用的 [46] 结果说:

因此,作者强调:

3. 举个类比

想象你有一本字典:

在本文里,“遵循词典的构造方式”就是说:他们的字典是严格按照物理规律构造的(阵列流形 → 每个网格点的响应),所以二值近似才有理论保证。

4. 总结

“遵循词典的构造方式” = 词典的原子是根据实际传播模型(阵列流形 + 网格化)构造的,而不是随便凑的

华为的总结!!!!!!!