World!

github of $Z_{2} O - K_{7} E$

contact with us: z2ok7e@gmail.com

Twitter: https://twitter.com/z2ok7e

Youtube channel: https://www.youtube.com/@z2o-k7e

TG Group: https://t.me/+zvn88S6jhf5lMzI9

z2o-k7e is a community-driven project dedicated to collaborative ZKP (Zero-Knowledge Proof) learning and zkp-tutorial writing . In 4 terms zkp co-learning journey since February 2023, we’ve explored & co-learned resources like https://www.zkiap.com, https://zk-learning.org, plonkathon , and 0xPARC halo2 (ongoing), engaging with over 300+ enthusiastic participants!

In this journey, our vibrant community learns collectively, assists one another with q-a, and write zkp-related content collaboratively.

At z2o-k7e, we award bounties to motivate learners for their tech insights, encourage active community maintenance, and promote the organization of ZKP-centric knowledge. Collectively, our mission is to enhance the quality of ZKP Public Goods.

🚀 In 2023, we completed 4 rounds of collaborative learning on different topics of zkp. Now, we plan to accomplish another 4 sessions of zkp collaborative learning in 2024, including advanced topics like plonky3/Nova/zkVM/STARK ….

🚩 Problem Statement:

The world of zkp is riddled with challenges - so many noises, steep entry barriers, convoluted learning processes, an absence of dedicated learning communities, and a deluge of often nebulous information. Through z2o-k7e & the zkp colearning community, we’re committed to confronting and tackling these issues head-on.

🌟 Core Contributors

Dr. Qi Zhou: Founder of ETHStorage
Yu Guo@Secbit: Founder of Secbit, https://github.com/sec-bit, author of understanding PLONK series
Kurt Pan: Ph.D. in Cryptography from Fudan University, author of cryptography.land , https://github.com/kurtpan666
Shirlene 孝羽: director of Creators colearning Community
Demian: z2o-k7e colearning community operator, core contributor.
Harry L: co-Founder of Rebase Community
dream@Scroll : core developer of Scroll
Our Maintainers:
- Po@EthStorage,
- KEEP,
- Frank Jz Liu,
- CJ,
- 周洋(Yang Zhou),
- 0xhhh@EthStorage,
- 啊咪咪小熊,
- 张康 Daniel,
- miles,
- 白菜,
- 笃行,
- Xor0v0
- Wel
- 阳小雪,
- 饭卡里还有不少钱呢…
- 羊驼

愿景 Vision

内容层面：随着 zkp 社群共学的进行，建设一系列质量极高的中英文 zkp tutorials

社区层面：

建设国内社群氛围最好，贡献参与度最高，内容质量极高的 web3 技术社群
作为中文 zkp 社区的窗口，不断培养和支持社群内 builder 的优质项目，引导大家贡献到国际化社区（如 PSE 等），同时将第一手优质信息共享至社群，引导讨论和积极贡献。

Roadmap

z2o-k7e 内容 Roadmap

Halo2 Tutorial 撰写 & 翻译到国际化社区 :
- Halo2 Tutorial –– 2023.11 完成
- Halo2 code practice –– 2023.11 完成
understanding PLONK Series 内容翻译 2024.1 完成
2024 年，结合共学社区 Topic，完善 4 期的内容产出
- 下一期研究方向(待定)：Plonky2/Plonky3/zkVM/Nova/IVC/PCD
更多 zkp 领域内容的细分（体系化）

z2o-k7e 产品

zkVM 实现与优化
Halo2 As A Compiler Series

贡献流程

Github 上 fork 本 Repo
可以在 ./src/zk-everything 下 mkdir 一个以自己名字命名的文件夹
src/SUMMARY.md 是前端网站显示的文件组织目录，可以修改该文件，找到一个合适的放置目录，将文章的本地 .md 文件位置链接过去
正常的 PR 流程
经老师们审核后领取 Bounty！

文章格式

内容模板

文章 metadata ，如「贡献者作者信息 (required）」，「标签、联系方式 (optional）」

> 作者: 如 @大壮 https://github.com/dazhuang      
> 标签: 如 halo2, Nova, STARK, Folding schema .... # mdbook 暂不支持 tag 功能
> 时间: 2023-09-10

比如：

作者：大壮

Author: 大壮

文章开始之前，可以添加 [TOC] 来让 mdbook 自动生成该文章的 Table of contents（目录）

[TOC]

可添加 admonition block，语法见这里

This will take a while, go and grab a drink of water.

文章正文（Markdown 格式的正文内容，无需担心 github 糟糕的渲染）
文章末尾可以列出「致谢」 & 「参考文献 References」

# References
 - [trapdoor-tech halo2 book](https://trapdoor-tech.github.io/halo2-book-chinese/user/simple-example.html)
 - [icemelon/HaiCheng Shen](https://github.com/icemelon/halo2-examples/blob/master/src/fibonacci/example3.rs)
 - [0xPARC halo2](https://learn.0xparc.org/)

如何添加图片？

推荐直接在 .md 文章同级目录 mkdir ./imgs 目录，mdbook 中直接引用该 imgs 目录相对路径
如果您使用的是 OSS 云存储，则无需考虑图片存储，只需一个 .md 文件即可~

配套代码(optional)

如果文章有对应的实战代码那就再好不过啦！

可以直接 PR 到另一个 Repo，新建一个目录即可。

├── Nova
├── README.md
├── halo2-doc
├── halo2-learn
├── [Your code repo here !!]  # mkdir your code repo here !!
└── zk-everything

这边还没想好怎么放，可能后面位置有改动，不过…反正先放就好了！

关于 md 渲染

众所周知，Github 网站的 Latex 等渲染功能非常弱鸡，往往需要一些奇技淫巧才能让公式等正常渲染出来。而在本 MDBOOK 中，您完全不需要关注这种伤害身心的问题，不需要给 github markdown 做专门的适配和魔改。在 Obsidian（或者如 Typora 等主流 Markdown 编辑器）里的 .md 文件显示是什么样的，本网站中都可完美无痛渲染！

本地 Dev 预览方法：

$ [安装 Rust]
$ cargo install mdbook mkbook-latex  mdbook-toc
$ mkbook serve --open       # 本地预览

Tips :

src/SUMMARY.md 是会在前端组织显示的所有文件目录及其链接
公式测试：可以在 katex.org 测试，大家在 Obisidian notes 里怎么写公式，前端就会咋显示，

（contribution by PR process）

💡 @Demian: 作为 zkp 新人，走了很多弯路，也整理下自己的学习路径和一些参考资料供大家入门。希望本教程可以帮助减少一些盲目的打击和莫名的痛苦，节省一点点时间

1. 建立对 zkp 的直观理解

① 在纵身潜入 ZKP 的海洋之前，可以先建立对它最直观的理解：

安比实验室（郭宇老师）所写的 zkp-intro 是公认目前全网最简洁易懂的 zkp 入门系列（而且还是中文的！！）

前 3 篇需要看懂，不了解的概念就 Google + chatgpt + 社群询问 …

Chap 4-5 主要是非交互的 Schnorr 和 CRS、哈密尔顿环路等，看不懂没关系，可以先放一放

2. 最小必要背景知识

在建立了对 ZKP 最直观的了解后，如果你还是打算要学下去的话，那么就开始准备一些最小必要的基础知识吧！

2.1 椭圆曲线 ECC

需要掌握椭圆曲线加密（ECC）原理（大概用时 30 min）

2.2 基础的群论、数论

初等数论 Number Theory

10 分钟直观理解群: 3Blue1Brown - 欧拉公式与初等群论
直观理解 - 如何给高中生解释群论？ - Group Theory 群论.pdf
- Number Theory 1.pdf

2.3 密码学基础

需要掌握：群环域概念、循环群、拉格朗日插值

视频课 (视频课 For 纯密码学小白)：密码学的数学基础
图解密码技术（第3版） 9.5 分密码学书籍，随便翻翻

2.4 ZK-SNARK 初识 & 原理:

需要掌握：直观理解循环群在 zk-snark 中是咋用的就可以，具体的算法细节可能要持续往后学，和 PLONK 的算法不断交叉回看才能懂。

推荐 sec-bit ZK-SNARK 的系列文章，也可在微信公众平台搜索，对于初学者先看 Part 1 / 2 就够了。

3. 理论交叉学习，我反复入门啊！

有了以上基础的打底，可以尝试一套体系完整的系列课程：

ZKIAP

ZKIAP 的课程是比较注重理论和实践结合的，第二课就有涉及到 Circom 写电路

zk-learning

理论详实，但是缺少代码实践，session 5 的 PLONK 是 top-down 讲解，搭配郭老师的理解 PLONK 系列会更佳

crypto notes

土耳其小哥整理的，非常赞的 notes

ProofsArgsAndZK

author: justin thaler

https://zkhack.dev/whiteboard

https://www.rareskills.io/zk-bootcamp

其他优秀的 Courses （随便看看）:

Zero Knowledge Canon, part 1 & 2 - a16z crypto
https://twitter.com/taikoxyz/status/1679468185291218944 ：

1. PSE appliedzkp.org/projects 
2. Rust
3. complaints about learning rust
4. Dan Boneh
5. "The Different types of ZK-EVM" article 
6. who was the first ZK-EVM.
7. ZK Summit – Zero Knowledge Summit
8. Zac Williamson inventing PLONK, running @aztecnetwork
9. @zeroknowledgefm podcast
10. Fiat-Shamir Transformation 
11. The Moon Math Manual https://github.com/LeastAuthority/moonmath-manual
12. ZK-Rollups that provide privacy by default are sometimes called ZK-ZK-Rollups
13. Circom
14. The "Proofs, Arguments, and Zero-Knowledge" book by Justin Thaler https://people.cs.georgetown.edu/jthaler/ProofsArgsAndZK.pdf
15. Brecht – @taikoxyz CTO and @PrivacyScaling contributor
16. ZK HACK
17. Definition wars
18. how one should write zkEVM or ZK-EVM or Zk-EVM or zk-EVM
19. Lagrange interpolation

4. PLONK 协议の奥义

PLONK 无疑是目前最值得学习，需要彻底掌握的协议

《理解 Plonk》

出品：Secbit @郭宇老师 , https://secbit.io/

是大家公认的全网（包括外网）最好的 PLONK Tutorial。

学习 PLONK，这一套就够了！（论文可以随便看一下）

PS: 如果文档看晕了，那么推荐郭老师的配套白板视频：

PLONK 代码实践

5. 要不…来点代码?

恭喜你来到了 Zero-knowledge 的荒原！下面就可以自己根据兴趣和方向选择一些代码进行研究和实践了

halo2

使用了 halo2 的 Applications:

ZK Email https://github.com/zkemail halo2
ZK Wordle: https://zordle.xyz/ halo2
Hammster： https://github.com/ytham/hammster halo2
zk-draw : Verifiable random draw with zero-knowledge of the random seed https://github.com/jae-cuz/zk-draw halo2
ZK Microphone: https://github.com/Miyamura80/ZKMicrophone
Building a Zero Knowledge web app with Halo 2 and Wasm (part 1)
zk-img: Fighting Deepfakes with Zero-Knowledge Proofs https://medium.com/@danieldkang/zk-img-fighting-deepfakes-with-zero-knowledge-proofs-9b76c23e3789 尚未开源

大部分由 @Kurt Pan 博士整理

Circom

使用了 Circom 的 Applications:

zkSudoku: https://zk-sudoku.vercel.app/ Circom
Tornado-Cash
Semaphore

学习路径：【EDITING…】

PSE demos

PSE Projects List : https://www.appliedzkp.org/projects

Semaphore

对于 Circom + ZKP 的代码实践例子比较多，首推 PSE 的 Semaphore，是个包括 zuzalu pass、Worldcoin 都有使用的 zkp 协议

Others:

【out of date】，请移步： zk Materials

Tools

Youtube 字幕神器
常用的希腊字母及其发音
github - Readme Latex
- 建议使用 $ $，我自己测试过是有效的

Hello ZKP

👩‍💻 作者: Jade 🔗 github仓库：awesome-zkp-learning

Introduction

如果你刚入门ZKP，个人推荐从视频课程开始，有老师带着学习，会更容易上手，并且课程也是比较系统的，能对ZKP有一个大致的把握。后续可以深入理论、项目、论文等等。ZKP和密码学、区块链紧密相关，因此这里也推荐了一些相关课程和书籍，而深入密码学又会发现和数学相关，特别是抽象代数、数论的知识，只能说前路漫漫，道阻且长，希望不会劝退你。

本文推荐资料概览如下：

xmind

本文的资料推荐完全是鉴于我个人的学习路径，是从我个人角度的一些推荐。每个人的专业背景与学习方法都有所不同，因此仅供参考。不管怎样，能从这里有所收获都是我莫大的荣幸。

闻道有先后，术业有专攻。我也一直在学习的路上，难免有所不足与错误，欢迎批评指正，与我讨论。

ZKP Courses

探索零知识证明系列 - 郭宇

如果你想通过博客文章来入门学习ZKP，强烈推荐郭宇老师的系列文章。相信很多人入门ZKP都是从这里开始的（至少我是😂）。推荐按照顺序来进行阅读，同时里面提到的一些概念可以结合 ZKP MOOC（见下一个推荐）中的第一讲Introduction and History of ZKP来进行学习，基本都有对应，不过ZKP MOOC中讲得更理论些。

ZKP MOOC - Zero Knowledge Proofs

如果你想系统了解ZKP，或者刚入门ZKP，这门课程强烈推荐。通过这门课程的学习，你会对ZKP有很深入的理解，同时课程涉及面也比较广。每节课的讲义都非常不错，值得反复回顾与学习。课程官网还给出了每节课的补充资料，可以延伸拓展。

Modern Zero Knowledge Cryptography - MIT IAP 2023

如果你想敲敲代码来学习ZKP，非常推荐这门课程，可以跟着课程学习Circom语言，自己动手写写电路约束。该课程还有课后作业，推荐自己做一做（我的作业是跟着ZK Shanghai 2023课程（可以看作该课程的中文版）做的，在下一条推荐中有我的作业链接，供参考）。

ZK Shanghai 2023 - Icer

如果你觉得直接看上一个推荐的英文课程Modern Zero Knowledge Cryptography有点难度，推荐看这个课程，可以理解为中文版。同时这门课程在讲解过程中也加入了老师的理解，有很多补充和扩展。课程的第7讲和第8讲邀请了陆晨博士来讲解，比较偏数学一些，但其中的FFT算法在ZKP中应用还比较多，如果不好理解可以找其他一些资料来补充学习。作为ZKP入门，可以先尝试去理解，后续用到再深入进行研究。

WTF-zk

如果你想了解ZKP的数学原理，这门教程是不错的选择，讲解了ZKP中用到的抽象代数的知识，同时结合python代码，能边学习理论边用编程进行实践。

Blockchain

了解区块链也有助于理解ZKP的应用场景。

区块链技术与应用 - 肖臻

🔗 bilibili课程视频

如果你想深入了解区块链，非常推荐这门课程，课程由浅入深，讲了比特币和以太坊底层原理。

Cryptography Courses

密码学系列课程 - lynndell

这门课程从密码学的常见算法讲起，再讲到零知识证明。每一节课都很硬核，老师的讲义非常棒，值得自己反复研读，强烈推荐。

密码学基础系列

ECDSA多签系列

zk系列

Cryptography I - Dan Boneh

如果你觉得上面推荐的课程密码学系列课程还不够过瘾，强烈推荐这门课程，同时推荐读读这门课程的讲义，非常全面，讲义中的证明比较多，前期可以选择跳过。

Plonk

对ZKP有一个大致的了解后，可以具体来学学一些证明系统，首推Plonk。

理解Plonk系列 - 郭宇

如果你想深入理解Plonk，强烈推荐郭宇老师的这一系列文章。有的文章中会涉及较多的数学公式，推荐自己跟着文章手写推导一遍（或者更多），由于这些置换证明、算术约束、拷贝约束、查表约束等会在很多证明系统中反复用到，因此这里打下扎实的基础还是非常有必要的。

Halo2

在学习了Plonk之后，就可以开始看看Halo2。官方教程The halo2 Book可以作为学习手册进行参考。下面推荐一些不错的课程。

Halo2 - 0xPARC

强烈推荐跟着这门课程来入门Halo2。不仅有理论的讲解，也有编程实践，课上跟着老师敲敲代码，课后再自己独立实现下，或者改改代码实现不同的约束，相信会对Halo2有更深入的理解。

Introduction
- 📝 笔记
Halo2 API & Building a Basic Fibonacci Circuit (Part 1)
- 📝 笔记
- 💻 example1.rs : Fibonacci 例子，advice 有三列。
Halo2 API & Building a Basic Fibonacci Circuit (Part 2)
- 💻 example2.rs : 对 Fibonacci 电路 example1.rs 进行了优化，advice 只需要一列。
- 💻 is_zero.rs : 判断是否为0电路。
- 💻 example3.rs : 利用判零电路 is_zero.rs 来实现简单的if-else逻辑。
Circuit Exercise (Part 1)
- 📝 笔记
Circuit Exercise (Part 2)
- 📝 笔记
Circuit Exercise (Part 3)
- 📝 笔记
Custom Gates
PLONK Cost Model

Halo2 - StarLi

这一系列的课程也可以作为上面推荐课程Halo2 - 0xPARC 的补充。

ZKEVM

ZKEVM或者ZKVM是一个非常庞大的项目，个人认为可以从一些介绍视频入手，有个大致的了解，再进行深入代码细节。（👀我还刚刚接触一点，下面是我看到的不错的资料，这里简单的做一些推荐，想更深入学习ZKVM或者ZKEVM，建议另外找更全面的资料）

📺 视频-zkEVM总览：Scroll的 Ye Zhang 大佬的讲解视频，对于初步了解zkEVM是什么有很大帮助。
📺 Dream@Scroll：halo2 (zkEVM gadgets) 分享

ZKP Books

Proofs, Arguments, and Zero-Knlowledge - Justin Thaler

关于ZKP的书籍，很多人首推这本书。（👀我还未细看这本书，后续看完补充更详细的描述）

The MoonMath Manual

这本书还是比较全面，涵盖初等代数、抽象代数、椭圆曲线、电路以及 ZKP 的知识，尽可能地不涉及过多的数学理论，同时又和实践进行结合，非常推荐。

Mathematics Books

Algebra

高等代数 - 丘维声

强烈推荐丘老师的这本教材，有上下两册，通过这本书一步一步自然地引入了群、环、域的概念，对入门抽象代数很有帮助。网上也有丘老师的课程视频，可以结合着学习。

抽象代数 - 张贤科

如果你想看抽象代数的中文教材，我觉得这本很不错，带你从群环域到伽罗瓦群，书中也有部分提到ZKP中常用的有限域，但更多还是整个抽象代数的理论知识，对深入理解有限域有很多帮助。如果想要深入研究有限域，推荐阅读有更细化的书籍（下面在Finite Fields中有对应推荐）。

A Book of Abstract Algebra - Charles C. Pinter

如果你想看抽象代数的英文教材，推荐这本。还是比较推荐英文资料，这样在看到一些英文术语时能够直接对应上。

Algebra A Graduate Course

这本作为一些学校的本科教材，也比较推荐。

Finite Fields

ZKP中的大部分证明系统都是基于有限域来进行计算的，因此很有必要深入学习下有限域的理论知识。下面先推荐一些大家都说还不错的书籍。（👀由于我还未细读，后续再补充上这些书籍的描述与区别）

Finite Fields - Rudolf Lidl, Harald Niederreiter, P. M. Cohn

Handbook of Finite Fields - Gary L. Mullen, Daniel Panario

Introduction to Finite Fields and their Applications - RUDOLF LIDL, HARALD NIEDERREITER

Applications of Finite Fields - IanF.Blake, XuHong Gao, Ronald C. Mullin, et al

Cryptography Books

图解密码技术

这本书非常适合密码学入门，图解系列的书籍都比较易懂。

Foundations of Cryptography

这本书有两卷，第I卷是 Basic Tools，第II卷是 Basic Applications。涵盖的内容非常全面，在第I卷的第4章就讲到了ZKP。（👀还未细看这本书，后续看完补充更详细的描述）

Handbook of Elliptic and Hyperelliptic Curve Cryptography - ODED GOLDREICH

（👀还未细看这本书，后续看完补充更详细的描述）

Coding Theory

在FRI中，涉及到Reed-Solomon编码，因此如果要研究这些证明系统相关的细节，就比较有必要学习编码理论相关知识。

Essential Coding Theory

这本书非常推荐，编码理论讲得非常深入。

ZKP Resources

这里推荐一些不错的ZKP学习资源。

Vitalik Buterin’s website：V神的博客文章，必看。
零知识证明学习资源汇总：非常不错的文章推荐列表，也包含一些经典论文。
微信公众号 - 星想法：有很多零知识证明文章与教程。
微信公众号 - XPTY：Kurt Pan老师的微信公众号，可以实时跟进ZKP和密码学的最新研究。
World of Z2O-K7E：收录了郭老师的系列文章，同时还涵盖了Plonk、Halo2、格密码等内容，非常丰富。
Zero Knowledge Canon：很全面的zk相关资料总结，有很多论文课程资源。
Awesome zero knowledge proofs (zkp): github仓库，丰富的ZKP相关资源汇总。
ZKProof：很全面的ZKP资源网站。
ZenGo X：有很多rust实现的加密算法库。
Twitter推荐：
- vitalik.eth
- 0xAA
- Wizard Glacier
- fft.eth
- 0xhhh

探索零知识证明系列

探索零知识证明系列作者：郭宇@Secbit: Founder of Secbit, https://github.com/sec-bit , https://secbit.io/

原链接：https://github.com/sec-bit/learning-zkp/

初识「零知识」与「证明」

探索零知识证明系列（一）

引言：

我认为区块链很难称为一个“技术”。它更像是一个领域，包罗万象。或者形而上地说，区块链更像一个有机体，融合了各种不同的理论技术。

零知识证明是构建信任的重要技术，也是区块链这个有机体中不可缺少的一环。

零知识证明是打通链上数据与链下计算的关键技术，也是实现链上数据隐私保护的重要途径

要解释「零知识证明」，我们需要先解释「证明」，然后解释什么是「知识」，最后再解释什么是「零知识」。

提醒：文章内容难免有不准确或不严谨的描述，还请各位专业人士拨冗指正。

本文将在 Github 进行更新与修正。

“证明” 的前世今生

什么是证明？很多人可能和我一样，看到这两个字，会不禁想起中学考卷中各种三角相似的几何图形，当老师在神奇地画出一条辅助线后，证明过程突然显而易见，然后会懊悔自己为何没想到。

古希腊：「证明」 == 「洞见」

数学证明最早源于古希腊。他们发明（发现）了公理与逻辑，他们用证明来说服对方，而不是靠权威。这是彻头彻尾的「去中心化」。自古希腊以降，这种方法论影响了整个人类文明的进程。

勾股定理的证明

上图是「勾股定理」的巧妙证明。历史上曾出现过许许多多精巧的证明，神奇的思路，天才的灵感。一旦一个命题被证明，上帝都无能为力。嗯，对了，还有那个「上帝不是万能的」证明：上帝不能造出一块他举不起来的石头。

一个数学证明往往暗藏无比深刻的「洞见」，相信很多人都看过「费马大定理」的故事[1]，这个定理证明横跨四百年，从费马写下「这里空间太小，我写不下」，到怀尔斯最终登顶，耗费了许多代人的聪明才智。最近如「彭加莱猜想」，稍微带点年代感的如「哥德巴赫猜想」，还有我非常敬佩的华裔科学家张益唐十年磨一剑，在仔细研究了「Goldston-Pintz-Yıldırım」和「Bombieri-Friedlander-Iwaniec.」的证明「洞见」之后，证明了「质数间的有界间隔」[2]。

自十七世纪，莱布尼茨起，人们就梦想找到一种机械的手段，可以来自动完成证明，而不再依赖天才的灵光一现。

二十世纪初：「证明」 == 「符号推理」

时间到了十九世纪末，康托、布尔、弗雷格、希尔伯特、罗素、布劳威、哥德尔等人定义了形式化逻辑的符号系统。而「证明」则是在利用形式化逻辑的符号语言编写的推理过程。逻辑本身靠谱么？逻辑本身「自恰」吗？逻辑推理本身对不对，能够证明吗？这让数学家/逻辑学家/计算机科学家发明（发现）了符号系统，语法 vs. 语义，可靠 vs. 完备，递归 vs. 无穷。（这部分精彩故事请参看『逻辑的引擎』一书[3]）。

1910年，罗素发表了洪(zhuan)荒(tou)巨著『数学原理』。在书中，罗素与怀特海试图将数学完整地「形式化」下来。如果能达到这样的目标，所有的数学成果都将以证明的方式建立在坚实的基础上。下图就是『数学原理（卷二）』中的一页：

其中110.643这是一个命题：「1+1=2」，然后接下来就是这个定理的证明。大家可能奇怪，难道 1+1 还需要证明吗？是的，在数学原理一书中，数字 0，1，2，…… 都有严格定义，「加法」、「乘法」、「等于」都要严格定义，然后每一步的推理都需要指出依据。证明意味着什么？证明是可能繁琐无比的、但是每一步推理都严格无误。书中大量的证明都机械式的，按照公理和推理规则进行一种证明的构造，寻找证明就好像可以交给一个人，然后他无脑在公理与推理规则的集合中进行机械查找。

似乎人们距离「定理的自动证明」并不遥远了。

不幸的是，哥德尔在 1931 年证明了「哥德尔不完备性定理」[4]，图灵在 1936 年证明了图灵机停机问题的不可判定性[5]。这些成果彻底终结了这个几百年的幻想。无论公理系统如何精巧设计，都无法抓住所有的真理。

证明不仅仅是一个严格推理，而且凝结了似乎很难机械化的创造性思维。证明中蕴含了大量的「知识」，每一次的突破，都将我们的认知提升到一个新的高度。不管是「洞见」，还是推理过程中所构造的「算法」，一个定理的证明的内涵往往远超出定理本身的结论。

六十年代：「证明」 == 「程序」

又过了半个世纪，到了六十年代，逻辑学家 Haskell Curry 和 William Howard 相继发现了在「逻辑系统」和「计算系统— Lambda 演算」中出现了很多「神奇的对应」，这就是后来被命名的「Curry-Howard Correspondence」。这个发现使得大家恍然大悟，「编写程序」和「编写证明」实际在概念上是完全统一的。而在这之后的 50 年，相关理论与技术发展使得证明不再停留在草稿纸上，而是可以用程序来表达。这个同构映射非常有趣：程序的类型对应于证明的定理；循环对应于归纳；……（这里推荐一本书：『软件基础』（Software Foundations 中译本）[6]）。在直觉主义框架中，证明就意味着构造算法，构造算法实际上就是在写代码。(反过来也成立，嗯，码农码的不是代码，是数学证明，:P)

目前在计算机科学领域，许多理论的证明已经从纸上的草图变成了代码的形式，比较流行的「证明编程语言」有 Coq，Isabelle，Agda 等等。采用编程的方式来构造证明，证明的正确性检查可以机械地由程序完成，并且许多啰嗦重复性的劳动可以由程序来辅助完成。数学理论证明的大厦正在像计算机软件一样，逐步地构建过程中。1996 年 12 月 W. McCune 利用自动定理证明工具 EQP 证明了一个长达 63 年历史的数学猜想「Ronbins 猜想」，『纽约时报』随后发表了一篇题为「Computer Math Proof Shows Reasoning Power」的文章[7]，再一次探讨机器能否代替人类创造性思维的可能性。

利用机器的辅助确实能够有效帮助数学家的思维达到更多的未知空间，但是「寻找证明」仍然是最有挑战性的工作。「验证证明」，则必须是一个简单、机械、并且有限的工作。这是种天然的「不对称性」。

八十年代：「证明」 == 「交互」

时间拨到1985年，乔布斯刚刚离开苹果，而 S. Goldwasser 博士毕业后来到了 MIT，与 S. Micali，Rackoff 合写了一篇能载入计算机科学史册的经典：『交互式证明系统中的知识复杂性』[8]。

GMR89

他们对「证明」一词进行了重新的诠释，并提出了交互式证明系统的概念：通过构造两个图灵机进行「交互」而不是「推理」，来证明一个命题在概率上是否成立。「证明」这个概念再一次被拓展。

交互证明的表现形式是两个（或者多个图灵机）的「对话脚本」，或者称为 Transcript。而这个对话过程，其中有一个显式的「证明者」角色，还有一个显式的「验证者」。其中证明者向验证者证明一个命题成立，同时还「不泄露其他任何知识」。这种就被称为「零知识证明」。

再强调一遍，证明凝结了「知识」，但是证明过程确可以不泄露「知识」，同时这个证明验证过程仍然保持了简单、机械，并且有限性。这听上去是不是有点「反直觉」？

交互式证明

Alice: 我想向你证明我有一个方程的解，w^3 - （w+1)^2 + 7 = 0 （方程的解：w=3）

Bob: 好啊，我听着呢

Alice: 但是我不会告诉你 x 具体是多少，除非你愿意掏钱，我才告诉你。

Bob: 可以啊，但是你要先证明你有方程的解，我再给钱你。

Alice: @#%^& （黑科技）

Bob: ?????? （黑科技）

Alice: &*#@! （黑科技）

Bob: ??????（黑科技）

…… （继续黑科技）

Alice: 好了，完了

Bob: 好吧，你确实有方程的解，不过是不是我掏了钱，你就会把答案告诉我？

Alice: 别废话，掏钱！

上面例子就是一个「交互式证明」。假设Alice知道方程的解， f(w) = 0，那么 Alice 如何让 Bob 确信她知道 w 呢？Alice 在「黑科技阶段」告诉了 Bob 一大堆的信息。好了，关键问题是，Bob 能不能从 Alice 所说的一大堆信息中猜出w 到底是几，或者能分析出关于 w 的蛛丝马迹呢？如果 Bob 有这个能力，Bob也许就没必要掏钱了，因为他已经获得了这个值钱的信息。

请注意，如果 Alice 与 Bob 的对话是「零知识」的，那么 Bob 除了知道 w 是 f(w)=0 的解之外，不能获取其它任何关于 w 的信息。这一点非常重要，这是保护 Alice 的利益。

现在回顾一下「零知识证明」这个词，英文叫「Zero-Knowledge Proof」。这个词包含三个关键部分：

零
知识
证明

各位可能已经有点感觉了，我们来尝试着解读一下：

零： Alice 泄露了关于 w 的「零」知识，也就是没有泄露知识。
知识：这里就是指的就是 w。
证明：就是Alice与Bob对话中的「黑科技部分」。

好了，证明也就是黑科技部分还没讲。看官们不要急，且听我慢慢道来。

零知识证明有什么用处？

一提零知识证明技术，很多人就想到了匿名 Coin，比如 Monero, 比如 ZCash。确实，这几个 Coin 很好地普及了零知识证明，我本人也是通过 ZCash 才第一次听说了零知识证明这个词。但是在更深入地了解这个技术之后，深深感觉这个技术的威力远不止这一点。

零知识证明技术可以解决数据的信任问题，计算的信任问题！

张三说他有100块钱，李四说他北大毕业，王五说要和八菲特共进午餐。空口无凭，Show me the proof。

show-me-the-proof

那么「零知识证明」能解决数据的信任如何理解呢？在上一篇文章『zkPoD: 区块链，零知识证明与形式化验证，实现无中介、零信任的公平交易』[9]里面，我提到了一个概念「模拟」：

零知识证明技术可以「模拟」出一个第三方，来保证某一个论断是可信的

换句话说，当我们收到一个加了密的数据，然后还有一个零知识证明。这个零知识证明是说「关于数据的 X 断言成立」，那么这等价于有一个天使在我们耳边悄声说，「关于数据的X 断言成立」！

trusted-party

对于这个 X 断言，可以非常灵活，它可以是一个 NP复杂度的算法。大白话讲只要我们能写一段程序（一个多项式时间的算法）来判断一个数据是否满足 X 断言，那么这个断言就可以用零知识证明的方式来表达。通俗点讲，只要数据判定是客观的，那么就零知识证明就适用。

零知识证明的一些用处：

数据的隐私保护：在一个数据表格中，多多少少都有一些信息不想被暴露，比如当年我的成绩单，我只想向人证明，我的成绩及格了，但是我不想让别人知道我到底考了61分还是62分，这会很尴尬。我没有心脏病，但是保险公司需要了解这一点，但是我不想让保险公司知道我的隐私信息。那我可以证明给保险公司看，我没有心脏病，但是病历的全部并不需要暴露。我是一家企业，我想向银行贷款，我只想向银行证明我具备健康的业务与还款能力，但是我不想让银行知道我们的一些商业秘密。
计算压缩与区块链扩容：在众多的区块链扩容技术中，Vitalik 采用 zkSNARK 技术能够给现有的以太坊框架带来几十倍的性能提升。因为有了计算的证明，同样一个计算就没必要重复多次了，在传统的区块链架构中，同样的计算被重复多次，比如签名的校验，交易合法性校验，智能合约的执行等等。这些计算过程都可以被零知识证明技术进行压缩。
端到端的通讯加密：用户之间可以互相发消息，但是不用担心服务器拿到所有的消息记录，同时消息也可以按照服务器的要求，出示相应的零知识证明，比如消息的来源、与发送的目的地。
身份认证：用户可以向网站证明，他拥有私钥，或者知道某个只要用户自己才知道的秘密答案，而网站并不需要知道，但是网站可以通过验证这个零知识证明，从而确认用户的身份
去中心化存储：服务器可以向用户证明他们的数据被妥善保存，并且不泄露数据的任何内容。
信用记录：信用记录是另一个可以充分发挥零知识证明优势的领域，用户可以有选择性的向另一方出示自己的信用记录，一方面可以有选择的出示满足对方要求的记录分数，同时证明信用记录的真实性。
构造完全公平的线上数字化商品的交易协议[9]。
更多的例子，可以是任何形式的数据共享，数据处理与数据传输。

举例：地图三染色问题

下面讲一个经典的问题，地图的三染色问题。如何用三种颜色染色一个地图，保证任意两个相邻的地区都是不同的颜色。我们把这个「地图三染色问题」转变成一个「连通图的顶点三染色问题」。假设每个地区都有一个首府（节点），然后把相邻的节点连接起来，这样地图染色问题可以变成一个连通图的顶点染色问题。

下面我们设计一个交互协议：

「证明者」Alice
「验证者」 Bob

Alice 手里有一个地图三染色的答案，请见下图。这个图总共有 6 个顶点，9 条边。

3c-0

现在 Alice 想证明给 Bob 她有答案，但是又不想让 Bob 知道这个答案。Alice 要怎么做呢？

Alice 先要对染过色的图进行一些「变换」，把颜色做一次大挪移，例如把所有的绿色变成橙色，把所有的蓝色变成绿色，把所有的橙色变成蓝色。然后 Alice 得到了一个新的染色答案，这时候她把新的图的每一个顶点都用纸片盖上，然后出示给 Bob 看。

3c-1

看下图，这时候 Bob 要出手了（请见下图），他要随机挑选一条「边」，注意是随机，不让 Alice 提前预测到的随机数。

3c-2

假设 Bob 挑选的是最下面的一条边，然后告诉 Alice。

3c-3

这时候 Alice 揭开这条边两端的纸片，让 Bob 检查，Bob 发现这两个顶点的颜色是不同的，那么 Bob 认为这次检验同构。这时候，Bob 只看到了图的局部，能被说服剩下的图顶点的染色都没问题吗？你肯定觉得这远远不够，也许恰好 Alice 蒙对了呢？其它没暴露的顶点可能是胡乱染色的。

没关系，Bob 可以要求 Alice 再来一遍，看下图

3c-4

Alice 再次把颜色做一次变换，把蓝色改成紫色，改绿色改成棕色，把橙色改成灰色，然后把所有的顶点盖上纸片。然后 Bob 再挑选一条边，比如像上图一样，选择的是一条竖着的边，然后让 Alice 揭开纸片看看，如果这时候 Bob 再次发现这条边两端的顶点颜色不同，那么 Bob 这时候已经有点动摇了，可能 Alice 真的有这个染色答案。可是，两次仍然不够，Bob 还想再多来几遍。

那么经过反复多次重复这三个步骤，可以让 Alice 作弊并能成功骗过 Bob 的概率会以指数级的方式减小。假设经过 n 轮之后，Alice 作弊的概率为 $P r [(G, c) ∣ T h ree C o l or (G, c) = 0] < (1 - \frac{1}{∣ E ∣})^{n}$

这里 |E| 是图中所有边的个数，如果 n 足够大，这个概率 Pr 会变得非常非常小，变得「微不足道」。

可是，Bob 每次看到的局部染色情况都是 Alice 变换过后的结果，无论 Bob 看多少次，都不能拼出一个完整的三染色答案出来。实际上，Bob 在这个过程中，虽然获得了很多「信息」，但是却没有获得真正的「知识」。

信息 vs. 知识

信息「Information」
知识「Knowledge」

在地图三染色问题的交互证明中，当重复交互很多次之后，Bob 得到了大量的信息，但是这好比 Alice 发给 Bob 一堆随机数一样，Bob 并没有「知道」更多的东西。打个比方，如果 Alice 告诉 Bob 「1+1=2」，Bob 得到了这个信息，可是 Bob 并没有额外获取更多的「知识」，因为这个事实人人皆知。

假如 Alice 告诉 Bob 2^2^41-1这个数是一个质数，很显然这个是「知识」，因为要算出来这个数是不是一个质数，这需要耗费大量的算力。

假如 Alice 告诉 Bob，总共有两个顶点用了绿颜色，那么 Bob 就获得了宝贵的「知识」，因为基于他刚刚获取的这个信息，Bob 可以用更短的时间用一台图灵机去求解三染色问题。假如 Alice 又透露给 Bob，最左边的顶点颜色是用橙色，那么很显然，这个「信息」对于 Bob 求解问题并没有实质上的帮助。

我们可以尝试定义一下，如果 Bob 在交互过程中获得的「信息」，可以帮助提升 Bob 直接破解 Alice 秘密的能力，那么我们说 Bob 「获得了知识」。由此可见，知识这个词的定义与 Bob 的计算能力相关，如果信息并不能增加 Bob 的计算能力，那么信息不能被称为「知识」。比如在 Alice 与 Bob 交互过程中，Alice 每次都掷一个硬币，然后告诉 Bob 结果，从信息角度看，Bob 得到的信息只是一个「事件」，然而 Bob 并没有得到任何「知识」，因为 Bob 完全可以自己来掷硬币。

下面引用『Foundations of Cryptography—— Basic Tools』一书[10]中的总结

「知识」是与「计算难度」相关，而「信息」则不是

「知识」是与公共所知的东西有关，而「信息」主要与部分公开的东西有关

注：曾有人问我，这里的信息与知识的定义是否与 Kolmogorov 复杂性有关。根据算法信息论，一段字符串的信息量可以用产生字符串的最小程序的长度来测量。这个问题我不是很懂，希望路过的专业人士留言。

可验证计算与电路可满足性问题

看了上面的地图三染色问题，大家是不是没有感觉，好像这只是一个学术问题，如何跟现实问题关联起来？地图三染色问题是一个 NP-Complete 问题，这是「计算理论」中的一个名词。另外有一个叫做「电路可满足问题」也是同样是 NP-Complete 问题。NP-Complete 是一类问题，他的求解过程是多项式时间内难以完成的，即「求解困难」，但是验证解的过程是多项式时间可以完成的，即「验证简单」。

那什么是电路呢？下面是三个不同的「算术电路」：

circuits

可以看到一个电路由很多个门组成，其中有加法门，还有乘法门。每一个门有几个输入引脚，有几个输出引脚。每一个门做一次加法运算，或乘法运算。别看这么简单，我们平时跑的（没有死循环）代码，都可以用算术电路来表示。

这意味着什么呢？我们下面结合「零知识证明」与「电路可满足性问题」来试着解决数据的隐私保护问题。

下面请思考一个场景：Bob 交给 Alice 一段代码 P，和一个输入 x，让 Alice 来运行一遍，然后把运行结果告诉 Bob。可能这个计算需要消耗资源，而 Bob 把计算过程外包给了 Alice。然后 Alice 运行了一遍，得到了结果 y。然后把 y 告诉 Bob。下面问题来了：

如何让 Bob 在不运行代码的前提下，相信代码 P 运行的结果一定是 y 呢？

这里是思考时间，大家可以想个五分钟 ……

（五分钟后……）

Alice 的一种做法是可以把整个计算过程用手机拍下来，这个视频里面包含了计算机 CPU，还有内存，在整个运行过程中的每一晶体管的状态。很显然这么做是不现实的。那么有没有更可行的方案呢？

答案是 Bob 把程序 P 转换成一个完全等价的算术电路，然后把电路交给 Alice。Alice 只要计算这个电路就可以了，然后这个过程是可以用手机拍下来的，或者用纸记下来，如果电路规模没有那么大的话。Alice 只要把参数 6 输入到电路，然后记录下电路在运算过程中，所有与门相连的引脚线上的值。并且最后的电路输出引脚的值等于 y，那么 Bob 就能确信 Alice 确实进行了计算。Alice 需要把电路的所有门的输入与输出写到一张纸上，交给 Bob，这张纸就是一个计算证明。

这样 Bob 完全可以在不重复计算电路的情况下来验证这张纸上的证明对不对，验证过程很简单：

Bob 依次检查每一个门的输入输出能不能满足一个加法等式或者一个乘法等式。

比如 1 号门是一个加法门，它的两个输入是 3，4，输出是7，那么很容易就知道这个门的计算是正确的。当 Bob 检查完所有的门之后，就能确信：

Alice 确确实实进行了计算，没有作弊。

这张纸上的内容就是「满足」算术电路 P 的一个解「Solution」。

所谓的电路可满足性就是指，存在满足电路的一个解。如果这个解的输出值等于一个确定值，那么这个解就能「表示」电路的计算过程。

对于 Alice 而言，Bob 如果用这种方式验证，她完全没有作弊的空间。但是这种方法很显然有个弊端：

弊端一：如果电路比较大，那么证明就很大，Bob 检查证明的工作量也很大。
弊端二：Bob 在验证过程中，知道了所有的电路运算细节，包括输入。

黑科技

我们再对刚才的 Alice 与 Bob 的场景做些修改。假如，Alice 自己还有一个秘密，比如说网银密码。而 Bob 想知道 Alice 的网银密码的长度是不是 20 位长。而 Alice 想了下，告诉他密码长度应该问题不大。这时候 Bob 把一个计算字符串长度的代码转换成了电路 Q，并且发给 Alice。Alice 用电路 Q 算了一下自己的密码，然后把电路所有门的引脚发给了 Bob，并带上运算结果 20。

Wai……t，这是有问题的，Bob 拿到电路运算过程中的所有内部细节之后，不就知道密码了吗？是的，Alice 显然不能这么做。那么 Alice 应该怎么做？

答案是有很多种办法，热爱区块链技术的读者最耳熟的就是 zkSNARK[11]，还有zkSTARK[12]，子弹证明BulletProof[13]，以及一些比较小众的技术，都可以帮 Alice 做到：

Alice 以一种零知识的方式，向 Bob 证明她计算过了电路，并且使用了她的秘密输入。

换句话说，这些「零知识的电路可满足性证明协议」为 Alice 提供了强大的武器来向 Bob 证明她的网银密码长度为 20，并且除此之外， Bob 再也得不到任何其它有用的信息。除了网银密码，Alice 理论上可以向 Bob 证明任何她的隐私数据的某些特性，但是并不暴露任何别的信息。

「零知识的电路可满足性证明协议」提供了一种最直接的保护隐私/敏感数据的技术

最近几年来，零知识证明构造技术发展日新月异，并且在区块链技术领域得到了越来越多的应用。最新的零知识证明技术，有的技术可以让 Bob 高速验证证明（在移动设备上几毫秒验证完成）；有的技术可以让所有吃瓜群众帮忙验证（非交互式零知识证明）；有的技术支持非常小的证明大小（小到几十个字节）。后续文章我们会逐步展开介绍。

写在最后

无论是精妙的数论定理，地图三染色问题，还是电路可满足性问题。证明存在的意义是什么？所有的证明都体现了「证明」与「验证」的「不对称性」。证明可能是一个非常耗费算力，或者脑力的活动，无论是耗时几百年的「费马大定理」，还是比特币中的 POW 证明，这些证明都凝结了在寻找证明过程中所消耗的能量，证明过程可能是超乎寻常的复杂，偶尔需要天才横空出世。而验证过程一定（或者应该）是一个非常简单的，机械的，在（多项式）有效时间内且能终止的活动。某种意义上，这个不对称性真正体现了证明的意义，展示了零知识证明的价值。

粗略看，「证明」是「逻辑」的产物，但「逻辑」与「计算」却又有着密不可分的联系，大家可能模模糊糊感觉到一些关于「证明」与「计算」之间的关联，它们贯穿始终：如机械推理、证明表达、交互计算。这是一个有趣但更宏大的哲学问题。

参考文献

[1] 西蒙, 辛格, 薛密. 费马大定理: 一个困惑了世间智者 358 年的谜[M]. 上海译文出版社, 1998.
[2] Alec Wilkinson. The Pursuit of Beauty: Yitang Zhang solves a pure-math mystery. The New Yorker. Feb. 2015.
[3] 马丁, 戴维斯, 张卜天. 逻辑的引擎[M]. 湖南科学技术出版社, 2012.
[4] Raymond Smullyan. Gödel’s Incompleteness Theorems, Oxford Univ.Press. 1991.
[5] Turing, Alan. “On computable numbers, with an application to the Entscheidungsproblem.” Proceedings of the London mathematical society 2.1 (1937): 230-265.
[6] Pierce, Benjamin C., et al. “Software foundations.” 中文译文: <https://github.com/Coq-zh/SF-zh
[7] Kolata, Gina. “Computer math proof shows reasoning power.” Math Horizons 4.3 (1997): 22-25.
[8] Goldwasser, Shafi, Silvio Micali, and Charles Rackoff. “The knowledge complexity of interactive proof systems.” SIAM Journal on computing 18.1 (1989): 186-208.
[9] zkPoD: 区块链，零知识证明与形式化验证，实现无中介、零信任的公平交易. 安比实验室. 2019.
[10] Oded, Goldreich. “Foundations of cryptography basic tools.” (2001).
[11] Gennaro, Rosario, et al. “Quadratic span programs and succinct NIZKs without PCPs.” Annual International Conference on the Theory and Applications of Cryptographic Techniques. Springer Berlin, Heidelberg, 2013.
[12] Ben-Sasson, Eli, et al. “Scalable, transparent, and post-quantum secure computational integrity.” IACR Cryptology ePrint Archive 2018 (2018): 46.
[13] Bünz, Benedikt, et al. “Bulletproofs: Short proofs for confidential transactions and more.” 2018 IEEE Symposium on Security and Privacy (SP). IEEE, 2018.

理解「模拟」

探索零知识证明系列（二）

I know that I know nothing —— 苏格拉底

相信很多人都听说过零知识证明，但是只有极少数人听说过模拟，然而模拟是理解零知识的关键。

我们在第一篇文章『初识「零知识」与「证明」』（链接）[1]中介绍了一个简单的零知识交互系统：地图三染色问题。那么这个系统真的是零知识的吗？我们为什么要相信这个结论呢？有证明吗？在 Alice 与 Bob 的对话过程中，如果不零知识，Alice就被坑了。交互式系统的设计者「我」需要让 Alice 确信，这个对话确实是零知识的。

如果从直觉主义角度解释，要证明一个交互系统中存在信息泄露，那么你只需要指证：第几个 bit 导致信息泄露即可；但如果要证明不存在信息泄露，那么你要对着所有信息流中的所有 bit 说，这从1，2，3，4，5，…… 编号的 bit 都没泄露任何信息。看官们，这是不是很难？

本文约八千字，略微烧脑。

安全的定义与不可区分性

首先，一个交互式系统，也就是一个对话，它的「零知识」需要证明。毕竟，现代密码学是建立在严格的形式化系统之上。在证明之前，还需要明确「安全假设」到底有哪些。所谓安全假设，比如我们说一个系统的权限隔离做得无比精确，每一个用户只能看到被授权的信息，但是这基于一个安全假设：管理员账号没有被破解。又比如在手机银行软件里，只能通过短信认证码，才能完成转账功能，这也基于一个安全假设：你的手机 SIM 卡没有被克隆。如果我们深入地分析每一个我们感觉安全的系统，都存在大量的似乎不那么稳固的安全假设。比特币私钥安全吗？比特币账户的安全假设也不少：首先你的助记词不能让别人知道，手机钱包里私钥保存加密算法足够强，密钥派生算法正规，你不能忘记助记词，等等等。

脱离安全假设来谈安全都是在耍流氓。一切安全都有前提的。只有经过数学证明之后，大家才能够确信这个算法/方案的安全性基于一些非常明确的「安全假设」。

在证明之前，还缺少一个东西，那就是「安全定义」。在多数人的认知系统中，安全就是一个框，什么都可以往里装。大家应该好好提醒下自己，当谈论安全二字的时候，有没有想过到底什么是安全？怎么算安全？

「安全」需要有一个数学意义上的严格定义

伟大的科学家香农（Claude Shannon）从信息论的角度给出了一个非常靠谱的安全性定义[2]：

完美安全：假设你是一个攻击者，你通过密文获取不到任何有价值的信息，破解的唯一手段就是靠瞎蒙。

大家想一想，这个定义很有趣，通过密文获取不到信息，这就意味着你没有获得任何额外的计算能力，能够帮助让你以更短的时间来计算出明文。

但是这个定义太完美，以至于使用的加密算法都很难满足这个安全性定义。后来 Goldwasser 与 Micali 等人写了另一篇载入史册的经典『概率加密』[2]。

在这篇论文中定义了这样一个概念：语义安全。所谓语义安全在完美安全的定义上放松了些要求。

语义安全：假设你是一个攻击者，你通过密文在多项式时间内计算不出来任何有价值的信息。

好了，这个看起来靠谱多了。接下来一个问题就是，怎么理解「计算不出来信息」这个概念？这看来要对信息进行度量，信息的定义又是什么呢？

我们又引入一个概念——「不可区分性」，来重新表述加密算法的安全性：假设你是一个攻击者，而我有一个加密算法：

你随机产生两段等长的明文，m1=「白日依山尽，黄河入海流」，m2=「烫烫烫烫烫，烫烫烫烫烫」
你把这两段明文，m1 与 m2 交给我
我随机挑选一个明文，不告诉你是哪一个，然后进行加密，产生一个密文 c
我把密文 c 出示给你看，让你猜这个c 究竟是由唐诗加密产生，还是乱码加密产生
如果你用一台计算机来破解c，在多项式时间内破解不出来，也就是说你没办法区分c的来源，那么就说明加密算法是语义安全的

OK，理解完「不可区分性」，我们再回到「零知识」，如何证明一个交互式系统是「零知识」呢？首先我们要定义下零知识这个概念。

注：不可区分性是概率意义上的不可区分；在学术上，它可以分为「完全不可区分」，「统计不可区分」，还有「计算不可区分」。在本文中，我们暂时不需要理解这些概念的差别。

遇见模拟器

先开个脑洞，设想在平行宇宙中，有两个平行的世界，一个叫做「理想世界」（Ideal World），另一个叫做「现实世界」（Real World）。我们每一个个体可以在两个平行世界中愉快地玩耍，但是两个世界的普通人无法互相感知，也无法互相沟通。

假设「你」是一个很厉害的密码破解者，而且「你」不是普通人，具备在平行宇宙之间穿梭的能力。而 Alice 有一个地图三染色的答案，你的目的是通过和 Alice 对话来获取地图三染色的答案，会话的过程参考上一篇文章的「地图三染色问题」协议。

继续脑洞，Alice 只存在「现实世界」中；在「理想世界」，Alice 被「替换」成了一个长相与声音一模一样的个体，我们称替身为 Zlice。下一步，把「你」同时放入两个世界中，但不让你知道是你当前位于哪一个世界。你的两个分身所面对的都是一个 “Alice”模样的人。

再重复一遍，在「现实世界」中，与你对话的是一个真实的，并且诚实的 Alice；而在「理想世界」中，与你对话的是 Zlice （假 Alice），Zlice 虽然相貌语言与 Alice 并无二致，但差异是，Zlice 并不知道「知识」，即不知道一个三染色问题的答案。

接下来在这两个世界中，你的两个分身将同时与真假 Alice 进行对话。神奇的事情发生了，最终在两个世界中，你的两个分身都被说服了，都经过n轮挑战，没有发现对方作弊，即「你」的两个分身都认为对方确实知道「答案」。换句话说，「你」没有能力「区分」出来自己到底在「现实世界」还是「理想世界」，当然也没能力「区分」和自己对话的究竟是 Alice 还是 Zlice。不仅如此，对于吃瓜群众我而言，如果把「我」作为观察者放入任何一个世界中，我会和你一样「无法区分」出来眼前的这个长相为 “Alice” 的人到底是真还是假。

下面是烧脑结论：

这个交互系统为何是「零知识」？因为 Zlice 是没有任何知识，而且她和 Alice 不可区分。

我再换个方式解释：因为你和我都没办法区分我们究竟是在哪个世界中，两个世界发生的交互过程几乎不可区分，而且其中一个世界中根本就不存在知识，因此，我们说这个交互协议——「地图三染色问题」是「零知识的」。

这里还有个前提，理想世界必须是算法可构造的。然后，有一个「神」，他通过算法「模拟」了一个「理想世界」，其中构造了一个算法叫做 Zlice，她没有「知识」作为输入，也即「零知识」；除此之外，「理想世界」与「现实世界」一模一样。

设想你在对话过程中，如果真 Alice 泄露了信息，那么你就能立即区分出面前这个人是真 Alice 还是 Zlice，Zlice 是不可能伪装泄露信息的。因此可以得出结论：

真Alice 没有泄露任何信息。

这个神，被称为「模拟器」（Simulator），而在理想世界中，和你对话的这个 Zlice 幻象其实也是「模拟器」，你在理想世界中，所有能感知到的东西都是模拟器「模拟」出来的。

好了，到这里，我们用「模拟器」这个概念对「零知识」进行了定义。

接下来，我们开始进入证明零知识的环节。

区分两个世界

（Save World State as Snapshot X）

证明的零知识过程，等价于构造（寻找）一个「模拟」算法，这个算法能够让模拟器来模拟出一个「没有知识」的理想世界。如果这个算法存在，而且两个世界不可区分，那么就证明完毕。

等等，可能「你」会觉得哪里不对劲。

假如说真的存在这种算法，而且它能够在没有知识的情况下骗过我，那么在「现实世界」中，不排除真 Alice 也使用了这样的算法来欺骗我。这样一来，我岂不是在两个世界中都被欺骗了。那么这个交互协议就失去意义了。

其实，这里有个关键点，借用电影『盗梦空间』中的剧照，在「理想世界」中有点东西是和「现实世界」本质不同的。这个东西是区分两个世界的关键，而它要让我们「无法感知」。这个东西不是梦境中的陀螺，它是一种「超能力」，模拟器 Simulator 所具备的超能力。

比如这样一种超能力：「时光倒流」。

（上图是电影『土拨鼠之日』的剧照，剧中主人公每次睡醒都会回到2月2日的早上，这样他永远活在同一天里）

等等，各位看官，不是刚才我们一直在讨论不可区分性吗？怎么两个世界又需要区分啦？“我糊涂了”。不要慌，所谓的不可区分性针对的是理想世界中的个体认知而言。而「可区分性」是对位于世界外部的神而言。

设想下在我们周围，如果有一个人有时空穿越能力，或者他能让时间回退到一年前，那么我们这些凡夫俗子完全是一脸茫（meng）然（bi）的，无从感知。那么，如果「模拟器」可以在他构造出的「理想世界」中实现「时间倒流」，那么他就可以达成一些神奇的事情，从而骗过作为验证者身份的「你」，也能骗过观察者「我」。对于「你」而言，你明白，在「理想世界」中，时间是可以回退的，但是在「现实世界」中，显然真 Alice 不可能拥有超能力。虽然你和我不能区分在哪个世界里，但是至少我们知道在两个世界中的其中「现实世界」里，对面那个Alice是没办法欺骗我们的，当然我们却不能说出我们到底在哪个世界中。

到此，交互协议的「零知识」已经证明完了。各位是否已经明白了？我再给大家再梳理下证明思路：

首先「零知识」是为了保护 Alice 的利益，因为 Alice 不想在交互过程中透露更多的信息给 Bob，不想让 Bob 知道她所拥有的秘密 w，甚至不想让 Bob 从交互的过程中分析出哪怕一丁点的信息。那么怎么保证这一点呢？「模拟器」这时候登场了，它能模拟出一个和现实世界外表一模一样的「理想世界」，然后「模拟器」在这个世界中可以轻松地骗过任何一个对手，让对方无法分辨自己是在现实世界中，还是理想世界中。因为「模拟器」手里没有那个秘密 w，「理想世界」是零知识的。又因为两个世界的不可区分性，所以我们可以得出结论：Alice 的交互协议是「零知识」的。

我们来看一个具体的例子，上一篇文章[1]中提到的地图3染色问题。

地图三染色问题的零知识证明

回忆一下「地图三染色问题交互系统」：

第一步：Alice 把地图染色答案做一次完全置换，然后将所有顶点盖上纸片，交给 Bob
第二步：Bob 随机挑选一条边
第三步： Alice 打开指定边的两端顶点的纸片，Bob检验两个顶点的颜色是否相同，如果不同则通过，如果相同则失败
回到第一步，重复 n 遍

我们接下来就来证明上述这个交互是零知识的，这里先假设验证者 Bob 是诚实的，这有助于大家理解这个证明过程。然后我们再讨论，如果 Bob 不诚实的证明方法。

在「理想世界」中，跟 Bob 对话的是一个「模拟器」，它模拟出了整个世界的样子。Bob 按照三染色问题的交互协议进行交互。模拟器并没有一个三染色答案，它索性把所有的顶点都染成了灰色。

首先，模拟器模仿 Alice ，把每个顶点用纸片盖起来。然后发给 Bob。

Bob 随机挑选了一条边，挑战证明者。

模拟器这时候不能打开纸片，因为这条边两端的颜色都是灰色啊。

这时候，模拟器要发挥「超能力」了，他运用时间倒流的技能，回到对话第一步之前。

模拟器现在处于第一步，他把最下面那条边的两端染上任意不同的颜色，然后重新盖上纸片，并发给 Bob。

Bob 这时候无法感知到时间已经倒退回第一步了，对他来说，一切都是新鲜的，他「诚实」地再次选择了最下面的边。

这时候模拟器就可以放心地打开纸片，让 Bob 检查。Bob 很显然会被骗过。然后 Bob 一轮轮地重复这个过程，每一次模拟器都能用时间倒流的方式骗过 Bob。

于是在理想世界中，模拟器并没有任何三染色答案的「知识」，却同样能骗过Bob，并且从概率上来看，与「现实世界」中被观察到的交互过程高度地一致（完全一致的概率分布）。于是上面的过程展示了模拟器的算法的存在性，也就相当于证明了交互系统的「零知识性质」。

不诚实的 Bob

在上面的证明过程中，有一个相当强的假设，就是每次时间倒流之后，Bob都会选择同一条边。如果 Bob 每次都会换一条不同的边呢？没关系，如果在模拟器第一次实施时间倒流之后，Bob又选择了不同的边，那么模拟器可以把颜色打乱之后，再次运行时间倒流，在多次时间倒流之后，Bob 极大的概率总会一次选择模拟器进行染色的那条边，然后这时候模拟器才走到第三步，打开纸片。

阿里巴巴、洞穴与芝麻开门

在网上众多的讲解「零知识证明」的中文科普文章中，有一个例子流传非常广，这就是阿里巴巴与强盗的故事。可惜地是，这些不同版本的故事都只讲了一半。那么我接下来讲一个不一样的「阿里巴巴」与「四十大盗」的故事：

在很久很久以前，在一个叫做巴格达的城市里，住着一个人叫阿里巴巴。每天阿里巴巴会到集市上买东西。

有一天，阿里巴巴被一个盗贼抢了钱包，于是他一路追着盗贼到了一个山洞口，然后盗贼就消失了。阿里巴巴发现洞口里面有两条岔路，如下图所示。

阿里巴巴不知道盗贼往哪边跑了，于是他决定去「左边」岔道看看，很快阿里巴巴就发现这是个死胡同，也不见盗贼踪影。然后他又去「右边」岔道检查，也是个死胡同，不见盗贼踪影。阿里巴巴自言自语道：「该死的盗贼跑哪去了呢？」

第二天，阿里巴巴又去集市买东西，这次另一个盗贼抢了他的篮子，然后阿里巴巴追着这个盗贼到了昨天同样的山洞口，然后盗贼又不见了，这一次阿里巴巴决定先去「右边」岔道看看，没有发现盗贼，然后再去左边看看，也同样不见盗贼。这好奇怪。

第三天，第四天，……，第四十天，同样的故事上演，阿里巴巴追着第四十个大盗到了神秘的洞口，盗贼就消失了。阿里巴巴想，这个山洞里面一定有机关，于是他躲在「右边」岔道的尽头，耐心地等了很长时间，这时一个盗贼跑了进来，走道岔道尽头之后，念了一个咒语「芝麻开门」。这时候墙壁居然打开了，盗贼跑进去之后，然后墙壁又合上了，这时候另一个受害者追了进来，找了半天，一无所获。

阿里巴巴随后等他们走了之后，试验了一下这个咒语，果然非常有效，而且阿里巴巴发现这个墙壁通向「左边」岔道。后来，阿里巴巴找到了更换咒语的办法，并且把一个新咒语和洞穴的地理位置写在了一张羊皮纸上。

注：到这里，故事并没有结束…. （上字幕）很久很久以后

在很多年后，到了80年代，阿里巴巴的羊皮纸流落到了几个密码学家手里，他们跑到巴格达，找到了洞穴的位置，尽管过了几个世纪，咒语居然仍然有效，这几个密码学家兴奋地打开墙壁，在两个岔道之间跑来跑去。

一家电视台很快知道了这个奇异事件，一个密码学家 Mick Ali（与密码学家 Micali 发音相似）决定向电视观众展示他知道这个咒语，首先，电视节目主持人把摄像机架在洞口，然后让所有人都在山洞口等待，这时候 Mick Ali一个人进入到山洞中，然后主持人抛一个硬币，来决定让 Mick Ali 从哪个岔道跑出来。为了纪念阿里巴巴与四十大盗，Mick Ali 重复了四十遍每次都成功。

节目非常成功。但很快，另外一个电视台眼红，也想拍一个类似的节目，但是Mick Ali 因为签了独家协议，没办法参与这个新节目。怎么办呢？第二个电视台的主持人心生一计，他找了一个和 Mick Ali 很像的演员，穿着打扮、姿态和说话口音都模仿 Mick Ali。然后他们开拍了，每次主持人掷硬币后，都让这个演员跑出来，但是很显然，演员并不知道咒语，没办法打开那个墙壁。于是有时候演员碰巧会成功，有时候则会失败，于是演员很辛苦，重复了将近一百次，才成功了四十次。最后这个狡猾的新节目主持人，把录制视频进行了剪辑，只保留了成功的片段，错误的片段都删除了。然后这个新节目和 Mick Ali 的节目在同一时间，不同频道播出。然后观众们完全无法区分哪个视频是真的，哪个视频是假的。第一个电视台的主持人完全明白 Mick Ali 是真正知道墙壁的咒语的人，但是他却不能把这个事实传递给无辜的观众们。

看到这里，大家是不是对「模拟」慢慢有了感觉？这里第二个电视台的主持人通过剪辑视频的方式，而不是「时间倒流」。他对「理想世界」，也就是电视中播出的内容所在的世界，进行了外部干预，达到了同样的效果。对理想世界而言，这种剪辑本质上就是一种超能力。

这个故事其实来源于一篇论文『如何向你的孩子解释零知识证明』（How to Explain Zero-Knowledge Protocols to Your Children）[3]，发表在1989年的美密会议上。

模拟与图灵机

一谈到超能力，大家有没有觉得这玩意不科学。是的，如果我们无脑地用「超能力」来解释任何事情，那么我们逻辑就无法自恰（Consistent）。在理想世界中，模拟器是不能随便开挂的，比如模拟器肯定不能直接修改 Bob 的内部状态，比如 Bob 在验证步骤明明验证失败，但是模拟器强硬去把验证结果改为「接受」，这会导致我们可以证明：「任何的交互系统都是零知识的」，这个错误结论。

模拟器不是理想世界中全能的上帝

那么模拟器到底可以是什么呢？模拟器其实只是一个图灵机。所谓的「时间倒流」，「剪辑录像」这类的所谓超能力并不是玄乎的超自然能力，而是图灵机可以实现的功能。计算机专业的朋友们肯定都用过 VMWare，虚拟机之类的软件，本文讲的「模拟器」完全可以想象成一个「虚拟机」软件，它能虚拟出一个计算机环境，这个虚拟环境就是我们上文说的「理想世界」。「时间倒流」如何解释呢？不知道大家有没有用过虚拟机软件的「快照」功能（Snapshot），使用快照的时候，虚拟机软件可以把整个虚拟计算机的所有状态保存下来，然后在任意时刻，虚拟机软件都可以重新回到保存快照的位置继续运行。

注：其实所谓时间倒流是计算机中的一个基本操作，在程序语言理论中有一个概念叫做 Continuation。抽象地讲，Continuation 表示从现在开始到未来的计算。Continuation这是控制流的一个显式抽象，而 goto，call-with-current-continuation，甚至 thread scheduling 都可以看做是操作 Continuation 的操作符。比如采用call/cc，也就是call-with-current-continuation 就可以轻松地实现「回溯」功能。保存快照可以理解为保存当前的 Continuation，而回到过去的某一刻，就是应用这个Continuation。

不管 Zlice 还是 Bob，还有我们的每一个观察者，都是一个个可执行程序。这些程序被拷贝到了虚拟机里。Zlice 与 Bob 的会话实际上就是这两个程序之间的通讯。观察者是 Hook 在 Zlice 与 Bob 进程 IO 上的程序。在上文的地图三染色「理想世界」的诚实 Bob，实际上是 Bob 进程调用了虚拟机的「随机数发生器」，而这个随机数发生器是能被 Zlice 操纵的。「现实世界」是外部运行虚拟机软件的计算机环境。

大家是不是又有所悟，我再强调一下：

证明零知识的过程，就是要寻找一个算法，或者更通俗点说，写出一段代码，它运行在外部计算机系统中，但是实现了虚拟机的功能。而且在虚拟机中，需要有一个不带有「知识」作为输入的 Zlice，可以骗过放入虚拟机运行的 Bob。

如果还没理解上面我这句话，请时光回退到『区分两个世界』这一小节，重新思考模拟。:P （Load World State from Snapshot X）

柏拉图的洞穴寓言

模拟无处不在，哥德尔不完备性定理就使用了模拟的概念，用哥德尔数（Godel Numbers）模拟了形式算术。图灵提出了「Universal Turing Machine」（通用图灵机）的概念，这种图灵机可以模拟自身。

但最早的「模拟」概念，出自『理想国』一书的第七卷[4]中，古希腊哲学家柏拉图讲了这么一则寓言——Allegory of Cave：

plato’s cave

设想在一个暗无天日的山洞中，有一排被锁链锁住的囚徒，他们从小就只能看到前方的墙壁。这些囚徒们身后是一堵墙，再后面有一堆放着火，在火与墙壁之间，有一些人举着道具和木偶来回走，这样道具木偶就会在火光映射下在墙壁上投下影子。而这些囚徒们整天就只能看着这些影子。因为这些囚徒们从打出生起，所闻所见就只是前方洞壁上的各种影子，他们会以为所看到的这些影子就是真实的世界。

然而有一天，一个囚徒偶然挣脱锁链，他回头看到了火。但是他从小到大仅能看到暗淡的影子，他第一次看到了明亮的火光。看到了道具和木偶，假如有人告诉他，这些道具和木偶才是实物，他一定会嗤之以鼻，会坚持认为影子才是真实的。

柏拉图假设说，如果这个囚徒强制拖出洞穴，到外面去看到真实的世界，一开始囚徒会不适应真实世界的光亮而感到刺目眩晕，他会因此而愤怒。但是当他慢慢适应了这个世界，看到太阳，树木，河流，看到星空，他逐渐明白，这个世界比洞穴中那个世界更为优越高级。他再也不想回到黑暗的洞穴生活中了。

过了一段时间，他对洞穴中的囚徒心生怜悯，于是想去把他们都带出来。但是当他再次返回洞穴中，他因为已经适应了外面明亮的世界，回到洞穴中反而看不清楚。被锁的囚徒们反而认为他的视力受损，胡言乱语，是个疯子，最后当他想尽办法把这群囚徒带出洞穴时，被囚徒们联手杀死。

这是则人类命运的寓言，就和那一排被锁链锁着的囚徒类似，我们以为眼睛看到的就是世界的真相,但实际上，那也许是幻象，就像洞穴墙壁上投下的影子一样。

未完待续

本文章介绍了理解零知识所需的关键概念——模拟。任何一个零知识的协议，都可以通过构造一个「理想世界」来理解。第一次接触这个概念的读者需要反复琢磨。

计算机科学中有两个方法论至关重要，第一个是「抽象」，第二个是「模拟」

回顾一下在地图三染色问题中，Bob 在「理想世界」与「现实世界」中的对话。虽然 Bob 无法区分两个世界，但是有一点，他可以确信：现实世界中，Alice 没有超能力。

问题来了，Alice 没有超能力，并不能直接证明 Alice 真的有答案。万一这个交互协议并不能保证 Alice 一定有知识呢？「零知识」保护了 Alice 的利益，谁来保证 Bob 的利益呢？这个问题留给下一篇。

致谢: 本文受密码学教授 Matthew Green 发表在2014年与2017年的两篇个人博客文章[10-11]启发。*

参考文献

[1] 初识「零知识」与「证明」. 安比实验室. 2019.
[2] Shafi Goldwasser and Silvio Micali, Probabilistic Encryption, Special issue of Journal of Computer and Systems Sciences, Vol. 28, No. 2, pages 270-299, April 1984.
[3]Quisquater, J.J., Quisquater, M., Quisquater, M., Quisquater, M., Guillou, L., Guillou, M.A., Guillou, G., Guillou, A., Guillou, G. and Guillou, S., 1989, August. How to explain zero-knowledge protocols to your children. In Conference on the Theory and Application of Cryptology (pp. 628-631). Springer, New York, NY.
[4] 柏拉图 and 吴献书, 1986. 理想国 (Vol. 1, No. 986, p. 1). 商务印书馆.
[5] Goldwasser, Shafi, Silvio Micali, and Charles Rackoff. “The knowledge complexity of interactive proof systems.” SIAM Journal on computing 18.1 (1989): 186-208.
[6] Oded, Goldreich. “Foundations of cryptography basic tools.” (2001).
[7] Rackoff, Charles, and Daniel R. Simon. “Non-interactive zero-knowledge proof of knowledge and chosen ciphertext attack.” Annual International Cryptology Conference. Springer, Berlin, Heidelberg, 1991.
[8] Goldreich, Oded, Silvio Micali, and Avi Wigderson. “Proofs that yield nothing but their validity or all languages in NP have zero-knowledge proof systems.” Journal of the ACM (JACM) 38.3 (1991): 690-728.
[9] zkPoD: 区块链，零知识证明与形式化验证，实现无中介、零信任的公平交易. 安比实验室. 2019.
[10] Matthew Green. Zero Knowledge Proofs: An illustrated prime. 2014. https://blog.cryptographyengineering.com/2014/11/27/zero-knowledge-proofs-illustrated-primer/
[11] Matthew Green. Zero Knowledge Proofs: An illustrated primer, Part 2. 2017. https://blog.cryptographyengineering.com/2017/01/21/zero-knowledge-proofs-an-illustrated-primer-part-2/

寻找「知识」

探索零知识证明系列（三）

And what, Socrates, is the food of the soul? Surely, I said, knowledge is the food of the soul. 苏格拉底，什么是灵魂的食物？我说过，当然是知识。 —— 柏拉图

导言：有些理论非常有趣，零知识证明便是其中之一，摸索了许久，想写点什么，与大家一起讨论。本文是『探索零知识证明』系列的第三篇。全文约 8,000 字，少量数学公式。

本文将在 Github 进行更新与修正。

「零知识」vs. 「可靠性」

我们在许多介绍零知识证明的文章中都能看到这样三个性质：

Completeness —— 完备性
Soundness —— 可靠性
Zero-Knowledge —— 零知识

但是少有文章深入解释这个特性背后的深意和洞见。

在『系列（二）理解「模拟」』一文中，我们介绍了「模拟器」这个概念。许多介绍文章也避而不谈「模拟」，但「模拟」可以说是安全协议中核心的核心，因为它是定义「安全性」的重要武器。

通常，我们定义安全会采用这样一种方式，首先列出一些安全事件，然后说明：如果一个系统安全，那么列出来的安全事件都不会发生。

Rather than giving a list of the events that are not allowed to occur, it (the definition of zero-knowledge proof) gives a maximalist simulation condition.

— Boaz Barak

借用密码学家 Boaz Barak 的话，翻译一下，「零知识证明」并不是通过给出一个不允许发生的事件列表来定义，而是直接给出了一个最极致的「模拟条件」。

所谓「模拟条件」是指，通过「模拟」方法来实现一个「理想世界」，使之与「现实世界」不可区分；而由于在理想世界中不存在知识，所以可以推导出结论：现实世界满足「零知识」。

我们继续分析下一个交互系统（安全协议）的三个性质：「完备性」、「可靠性」与「零知识」。

可靠性（Soundness）：Alice 在没有知识的情况下不能通过 Bob 的验证。

完备性（Completeness）：Alice 在有知识的情况下可以通过 Bob 的验证。

零知识（Zero-knowledge）：Alice 在交互的过程中不会泄露关于知识的任何信息。

我们可以看出来「可靠性」和「完备性」有一种「对称性」。可靠性保证了恶意的 Alice 一定失败，而完备性保证了诚实的 Alice 一定成功。

「完备性」比较容易证明，只要 Alice 诚实，Bob 也诚实，那么皆大欢喜。这好比，写好一段代码，喂了一个测试用例，跑完通过收工。

我们来想想「可靠性」应该如何定义？这个可靠性的逆否命题是：（在现实世界中）如果 Alice 能通过 Bob 的验证，那么 Alice 一定有知识。或者说：Alice 知道那……个「秘密」！

下面的问题是如何证明 Alice 知道一个「秘密」？

这好像也很难，对不对？假如我们需要证明一台机器知道一个「秘密」，最简单的办法就是我们在机器的硬盘里，或者内存中找到这个「秘密」，但是这样暴露了秘密。如果这台机器是黑盒子呢？或者是 Alice 呢？我们没有读心术，猜不到她心里的那个秘密。

如何定义「To Know」？

「零知识」保证了验证者 Bob 没有（计算）能力来把和「知识」有关的信息「抽取」出来。不能抽取的「知识」不代表不存在。「可靠性」保证了知识的「存在性」。

只有「知识」在存在的前提下，保证「零知识」才有意义

本文将探讨「可靠性」和「To Know」。

为了进一步分析「知识」，接下来首先介绍一个非常简洁，用途广泛的零知识证明系统 —— Schnorr 协议。这个协议代表了一大类的安全协议，所谓的 Σ-协议，而且 Schnorr 协议扩展也是零知识数据交换协议 zkPoD [1] 的核心技术之一。

简洁的 Schnorr 协议

Alice 拥有一个秘密数字，a，我们可以把这个数字想象成「私钥」，然后把它「映射」到椭圆曲线群上的一个点 a*G，简写为 aG。这个点我们把它当做「公钥」。

sk = a
PK = aG

请注意「映射」这个词，我们这里先简要介绍「同态」这个概念。椭圆曲线群有限域之间存在着一种同态映射关系。有限域，我们用 Zq这个符号表示，其中素数 q是指有限域的大小，它是指从 0, 1, 2, …, q-1 这样一个整数集合。而在一条椭圆曲线上，我们通过一个基点，G，可以产生一个「循环群」，标记为 0G, G, 2G, …, (q-1)G，正好是数量为 q个曲线点的集合。任意两个曲线点正好可以进行一种「特殊的二元运算」，G + G = 2G，2G + 3G = 5G，看起来这个二元运算好像和「加法」类似，满足交换律和结合律。于是我们就用 +这个符号来表示。之所以把这个群称为循环群，因为把群的最后一个元素 (q-1)G，再加上一个 G就回卷到群的第一个元素 0G。

给任意一个有限域上的整数 r，我们就可以在循环群中找到一个对应的点 rG，或者用一个标量乘法来表示 r*G。但是反过来计算是很「困难」的，这是一个「密码学难题」—— 被称为离散对数难题[2]。

也就是说，如果任意给一个椭圆曲线循环群上的点 R，那么到底是有限域中的哪一个整数对应 R，这个计算是很难的，如果有限域足够大，比如说 256bit 这么大，我们姑且可以认为这个反向计算是不可能做到的。

Schnorr 协议充分利用了有限域和循环群之间单向映射，实现了最简单的零知识证明安全协议：Alice 向 Bob 证明她拥有 PK 对应的私钥 sk。

第一步：为了保证零知识，Alice 需要先产生一个随机数，r，这个随机数的用途是用来保护私钥无法被 Bob 抽取出来。这个随机数也需要映射到椭圆曲线群上，rG。

第二步：Bob 要提供一个随机数进行挑战，我们把它称为 c。

第三步：Alice 根据挑战数计算 z = r + a * c，同时把 z发给 Bob，Bob通过下面的式子进行检验：

z*G ?= R + c*PK = rG + c*(aG)

大家可以看到 Bob 在第三步「同态地」检验 z 的计算过程。如果这个式子成立，那么就能证明 Alice 确实有私钥 a。可是，这是为什么呢？

z 的计算和验证过程很有趣，有几个关键技巧：

首先 Bob 必须给出一个「随机」挑战数，然后 Bob 在椭圆曲线上同态地检查 z 。如果我们把挑战数 c 看成是一个未知数，那么 r+a*c=z 可以看成是一个一元一次方程，其中 r 与 a 是方程系数。请注意在 c 未知的前提下，如果 r + a*x = r' + a'*x 要成立，那么根据 Schwatz-Zippel 定理[3]，极大概率上 r=r'，a=a' 都成立。也就是说， Alice 在 c 未知的前提下，想找到另一对不同的 r',a' 来计算 z 骗过 Bob 是几乎不可能的。这个随机挑战数 c 实现了r 和 a 的限制。虽然 Bob 随机选了一个数，但是由于 Alice 事先不知道，所以 Alice 不得不使用私钥 a 来计算 z。这里的关键： c 必须是个随机数。
Bob 验证是在椭圆曲线群上完成。Bob 不知道r，但是他知道 r 映射到曲线上的点R；Bob 也不知道 a，但是他知道 a 映射到曲线群上的点 PK，即 a*G。通过同态映射与Schwatz-Zippel 定理，Bob 可以校验 z 的计算过程是否正确，从而知道 Alice 确实是通过 r 和 a 计算得出的 z，但是又不暴露 r 与 a 的值。
还有，在协议第一步中产生的随机数 r 保证了 a 的保密性。因为任何一个秘密当和一个符合「一致性分布」的随机数相加之后的和仍然符合「一致性分布」。

证明零知识

我们这里看一下 Schnorr 协议如何证明一个弱一些的「零知识」性质——「SHVZK」：

注：这里我们证明的仅仅是 Special Honest Verifier Zero-Knowledge（SHVZK）。SHVZK 要求协议中的 Bob 的行为不能不按常理出牌，比如他必须按协议约定，在第二步时，去传送带上取一个新鲜的随机数，并且立即使用。而通常意义上的「零知识」是不会对 Bob 做任何要求，所以我们说这里是一个弱一些的性质。虽然目前 Schnorr 协议不能证明完全的「零知识」，但经过添加一些协议步骤，就可以达到完全零知识的目的，细节这里不展开，有兴趣的读者请参考文献[4]。以后我们在讨论 Fiat-Shamir 变换时，还会再次讨论这个问题。

首先「模拟器」模拟一个「理想世界」，在理想世界中模拟出一个 Zlice 和 Bob 对话，Zlice 没有 Schnorr 协议中的知识，sk，而 Bob 是有公钥 PK的。请大家看下图，Bob 需要在 Schnorr 协议中的第二步出示一个随机数 c，这里有个额外的要求，就是 Bob 只能「诚实地」从一个外部「随机数传送带」上拿一个随机数，每一个随机数都必须是事先抛k次「硬币」产生的一个 2^k 范围内的一次性分布随机数。Bob 不能采用任何别的方式产生随机数，这就是为何我们要求 Bob 是诚实的。

下面演示 Zlice 如何骗过 Bob：

序幕：请注意 Zlice 没有关于sk的知识，这时 Bob 的随机数传送带上已经预先放置了一些随机数。

第一步：Zlice 产生一个一致性分布的随机数c，并且利用一个新的「超能力」，将刚刚产生的随机数 c 替换掉 Bob 的随机数传送带上第一个随机数。这时候，Bob 无法察觉。

第二步：Zlice 再次产生一个随机数 z，然后计算 R'=z*G - c*PK，并将 R'发送给 Bob。

第三步：这时候Bob 会从随机数传送带上取得 c，并且将 c 发送给 Zlice。请注意这个c 正好就是第一步中 Zlice 产生的 c。

第四步：Zlice 将第三步产生的随机数 z 发送给 Bob，Bob 按照 Schnorr 协议的验证公式进行验证，大家可以检查下，这个公式完美成立。

大家可以再对比下「现实世界」的 Schnorr 协议，在两个世界中，Bob 都能通过验证。

但区别是：

在「理想世界中」，Zlice 没有 sk；而在「现实世界中」，Alice 有 sk
在「理想世界中」，z 是一个随机数，没有涉及 sk；而在「现实世界中」，z 的计算过程里面包含 sk
在「理想世界中」，Zlice 使用了超能力，替换了 Bob 的随机数；而在「现实世界中」，Alice 看不到 Bob 的随机数传送带，也无法更改传送带上的数字

这里请大家思考下：Schnorr 协议中，Bob 在第二步发挑战数能不能和第一步对调顺序？也就是说 Bob 能不能先发挑战数，然后 Alice 再发送 R = r*G。

（两分钟后……）

答案是不能。

如果 Alice 能提前知道随机数，那么（现实世界中的）Alice 就可以按照模拟器 Zlice 做法来欺骗 Bob。

再遇模拟器

其实，「可靠性」和「零知识」这两个性质在另一个维度上也是存在着一种对称性。可靠性保证了恶意的 Alice 一定失败，零知识保证了恶意的 Bob （窃取知识）一定不会成功。有趣地是，这种对称性将体现在模拟出来的「理想世界」中。

我们分析下可靠性这个定义：Alice 没有知识导致 Bob 验证失败。它的逆否命题为：Bob 验证成功导致 Alice 一定有知识。

我们再次求助模拟器，让他在可以发挥超能力的「理想世界」中，去检验 Alice 的知识。

再次，请大家设想在平行宇宙中，有两个世界，一个是叫做「理想世界」，另一个叫做「现实世界」。理想世界有趣的地方在于它是被「模拟器」模拟出来的，同时模拟器可以在理想世界中放入带有超能力的 NPC。这次把 Alice 的两个分身同时放入「理想世界」与「现实世界」。

假设「你」扮演 Bob 的角色，你想知道和你对话的 Alice 是否真的是「可靠的」。于是把你放入「理想世界」，借助一个具有超能力的 NPC，你可以把对面的 Alice 的知识「抽取」出来。

W…hat？我们不是刚刚证明过：协议是零知识的吗？零知识就意味着 Bob 抽取不出任何的「知识」碎片。这里敲黑板，「零知识」是对于「现实世界」而言的。我们现在正在讨论的是神奇的「理想世界」。

重复一遍，在「理想世界」中，你可以借助一个有超能力的 NPC 来抽取 Alice 的知识，从而可以保证「现实世界」中的 Alice 无法作弊。可以想象一下，一个作弊的 Alice，她肯定没有知识，没有知识也就不可能在「理想世界」中让 NPC 抽取到任何东西。

然而在「现实世界」中，你无法借助 NPC，当然也就看不到 Alice 的知识，也就不会和「零知识」性质冲突。因为两个世界发生的事件是「不可区分」的，我们可以得到这样的结论：在「现实世界」中，Alice 一定是存在知识的。

整理一下思路：如何证明在一个交互会话中 Alice 不能作弊呢？我们需要为这个交互会话定义一个「模拟算法」，该算法可以模拟出一个「理想世界」，其中有一个特殊的角色叫做「抽取器」(Extractor)，也就是我们前面说的 NPC，它能够通过「超能力」来「抽取」Alice 的知识，但是让对方「无所察觉」。

注意，超能力是必不可少的！这一点在『系列（二）理解「模拟」』有解释，如果模拟器在没有超能力的情况下具备作弊能力，那相当于证明了协议「不可靠」（Unsoudness）。同样地，如果「抽取器」在没有超能力的情况下具备抽取信息能力，那相当于证明了协议不零知（Not-zero-knowledge）。

最后一点，超能力是什么？这个要取决于具体的交互系统的证明，我们接下来就先拿我们刚刚讲过的Schnorr 协议切入。

Proof of Knowledge ：「知识证明」

我们来证明一下 Schnorr 协议的「可靠性」，看看这个超能力 NPC 如何在「理想世界」中把 Alice 私钥抽取出来。而这个「超能力」，仍然是「时间倒流」。

schnorr-extractor-1

第一步：Alice 选择一个随机数 r，并且计算 R=r*G，并将 R 发给「抽取器」

schnorr-extractor-2

第二步：抽取器也选择一个随机的挑战数c，并且发给 Alice

schnorr-extractor-3

第三步：Alice 计算并且回应 z，然后抽取器检查 z是否正确

schnorr-extractor-4

第四步：抽取器发现 z 没有问题之后，发动超能力，将时间倒回第二步之前

schnorr-extractor-5

第五步：抽取器再次发送一个不同的随机挑战数 c'给 Alice，这时候 Alice 回到第二步，会有一种似曾相识的感觉，但是无法感知到时间倒回这个事实

schnorr-extractor-6

第六步：Alice 再次计算了 z'，然后发给抽取器检查

schnorr-extractor-7

第七步：这时候抽取器有了z和z'，就可以直接推算出 Alice 所拥有的私钥 a，达成「知识抽取」

到这里，「可靠性」就基本证明完了。大家是不是对可靠性和零知性的「对称性」有点感觉了？

总结一下：「抽取器」在「理想世界」中，通过时间倒流的超能力，把 Alice 的「知识」完整地「抽取」出来，这就保证了一个没有知识的 Alice 是无法让抽取器达成目标，从而证明了「可靠性」。

注：并不是所有的可靠性都必须要求存在抽取器算法。采用抽取器来证明可靠性的证明系统被称为「Proof of Knowledge」。

解读 ECDSA 签名攻击

在区块链系统中到处可见的ECDSA 签名方案也是一个朴素的零知识证明系统。椭圆曲线数字签名方案 ECDSA 与 Schnorr 协议非常接近，基于 Schnorr 协议的签名方案发表在 1991年的『密码学杂志』[5]上。1991年，正值美国国家标准局（NIST）选择数字签名算法，优雅的 Schnorr 签名方案居然被申请了专利，因此 NIST 提出了另一套签名方案 DSA（Digital Signature Algorithm），随后这个方案支持了椭圆曲线，于是被称为 ECDSA。中本聪在构思比特币时，选择了 ECDSA 作为签名算法，但是曲线并没有选择 NIST 标准推荐的椭圆曲线 —— secp256-r1，而是 secp256-k1。因为江湖传言，NIST 可能在椭圆曲线参数选择上做了手脚，导致某些机构可以用不为人知的办法求解离散对数难题，从而有能力在「现实世界」中具备超能力。有不少人在怀疑，也许当年中本聪在设计比特币时，也有这种考虑，故意选择了 secp256-k1 这样一条貌似安全性稍弱的曲线。

我们拆解下 ECDSA 签名，用交互的方式定义一个类似 ECDSA 的认证方案，交互见下图。

ecdsa-sig

第一步：Alice 仍然是选择一个随机数 k，并将 k 映射到椭圆曲线上，得到点 K ，然后发送给 Bob

第二步：Bob 需要产生两个随机数，c 和 e，然后交给 Alice

第三步：Alice 计算 s，并且发送给 Bob，他来验证 s 的计算过程是否正确

注：对熟悉 ECDSA 签名方案的读者，这里略作解释，Bob 产生的 c 对应被签消息的 Hash 值 Hash(m)，而 e 则是由一个转换函数 F(K)来产生。其中 F(.) 是取椭圆曲线上的点的 x 坐标经过 (mod q) 得到[6]。

江湖上流传着一个说法：ECDSA 签名方案有个严重的安全隐患，如果在两次签名中使用了同一个随机数，那么签名者的私钥将会暴露出来。其实 Schnorr 签名方案也有同样的问题。

当年 Sony PlayStation 3 的工程师在调用 ECDSA 库函数时，本来应该输入随机数的参数位置上，却传入了一个常数。熟悉密码学的黑客们发现了这个严重的后门。2011年1月，神奇小子 Geohot 公开发布了 Sony PS3 的主私钥，这意味着任何用户都可以轻松拿到游戏机的 root 权限。Sony 随后大为光火…… （后续故事大家可以上网搜）

如果 Alice 在两次交互过程中使用了同一个 K，那么 Bob 可以通过发送两个不同的 c 和 c' 来得到 s 和 s'，然后通过下面的公式算出私钥 a：

k = (c - c')/(s - s')
a = (k * s - c)/e

那么我们应该怎么来看这个「安全后门」呢？大家想想看，这个安全后门和我们前面证明过的 Schnorr 协议的可靠性证明几乎一模一样！这个算法正是 ECDSA 认证协议的「可靠性」证明中的「抽取器」算法。只不过在可靠性证明中，为了让 Alice 使用同一个随机数 k 来认证两次，「抽取器」需要利用「时间倒流」的超能力。

但是在 Sony PS3 系统中，随机数被不明所以的工程师写成了一个固定不变的值，这样相当于直接赋予了黑客「超能力」，而这是在「现实世界」中。或者说，黑客在不需要「时间倒流」的情况下就能实现「抽取器」。

提醒下，不仅仅是随机数不能重复的问题。而是随机数必须是具有密码学安全强度的随机数。

设想下，如果随机数 r 是通过一个利用「线性同余」原理的伪随机数生成器产生，虽然 r的值一直在变化，但是仍然不能阻止「知识抽取」。假设线性同余算法为 r2= d*r1 + e (mod m)，还回到 Schnorr 协议的第三步：

1: z1 = r1 + c1*a
2: z2 = r2 + c2*a

如果攻击者让 Alice 连续做两次签名，那么将 r2 代入 r1 之后，就出现了两个线性方程求解两个未知数 (r1, a) 的情况，z1, z2, c1, c2, d, e 对于攻击者是已知的，这个方程组只用初中数学知识就可以求解。

请注意，这并不是 Schnorr 协议（或 ECDSA 协议）的「设计缺陷」，恰恰相反，这是 Schnorr 协议设计比较精巧的地方，它从原理上保证了协议的可靠性。类似技巧在密码学协议中频繁出现，达到一目了然的「简洁」。但是也不得不说，如果不清楚协议的内在机制，尤其是区分不清楚「理想世界」与「现实世界」，使用者很容易引入各种花式的「安全漏洞」。

作为一个能写出可靠软件的靠谱码农，我们需要了解哪些？彻底理解安全协议的设计机制当然是最好的，但是绝大多数情况下是非常耗费精力的。一般来说，我们把各种密码学工具当做「黑盒」来用，可能是不够的，我们最好还能了解下：

「安全定义」是什么？
「安全假设」到底是什么？
「理想世界」中的「超能力」到底是什么？

脑洞：我们生活在模拟世界中吗

第一次读懂「模拟器」时，我第一时间想到的是电影『黑客帝国』。我们生活所在「现实世界」也许是某一个模拟器模拟出来的「理想世界」，我们所看到、听到的以及感知到的一切都是被「模拟」出来的。在「现实世界」里，我们活在一个母体中。然而我们并不能意识到这一点。

早在春秋战国时期，庄子也在思考类似的问题：

昔者庄周梦为胡蝶，栩栩然胡蝶也，自喻适志与，不知周也。俄然觉，则蘧蘧然周也。不知周之梦为胡蝶与，胡蝶之梦为周与？周与胡蝶，则必有分矣。此之谓物化。——《庄子·齐物论》

通俗地解释下：庄子有一天睡着了，梦见自己变成了一只蝴蝶，翩翩起舞，醒来之后发现自己还是庄子，在梦中，蝴蝶并不知道自己是庄子。于是庄子沉思到底是他梦中变成了蝴蝶，还是蝴蝶梦中变成了庄子呢？如果梦境足够真实，……

「缸中之脑」是美国哲学家 Gilbert Harman 提出的这样一个想法：一个人的大脑可以被放入一个容器里面，然后插上电线，通过模拟各种电信号输入，使得大脑以为自己活在真实世界中。

这个想法源自哲学家笛卡尔的《第一哲学沉思集》[7]，在书中他论证我们应该怀疑一切，需要逐一检验所有人类的知识，数学，几何，以及感知到的世界。然而他发现除了「我思故我在」之外，所有的知识都可能不靠谱，因为我们的大脑很可能被一个具有「超能力」的 Evil Demon 所欺骗。

2003 年牛津大学的哲学教授 Nick Bostrom 郑重其事地写了一篇论文『我们生活在计算机模拟世界中吗？』[8]。认为以下三个事实中，至少有一个成立：

人类文明彻底灭绝。
人类文明已经到达可以完全模拟现实世界的科技水平，但是处于某种原因，没有一个人愿意去创造出一个新的模拟世界，充当上帝的角色。
我们现在的人类文明就生活在一个模拟世界中。

硅谷企业家 Elon Musk 在一次公开采访中，谈到「我们生活在基础现实世界」的概率只有「十亿分之一」。也就是说，他认为我们生活在一个电脑游戏（模拟世界）中，在模拟世界之外，有一个程序员，他开发并操纵了这个世界，我们每个人都是一个游戏角色（ NPC）。

在玩腻越狱 iPhone 和自动驾驶之后，神奇小子 Geohot 在今年三月份的「西南偏南」大会上做了一个题为「Jailbreaking the Simulation」的演讲[9]。他认为，我们被生活在一个模拟世界中，所谓的上帝就是外部世界里活蹦乱跳的码农们，他们编程创造了我们的「现实世界」，当然，他们可能启动了不止一个世界副本。然而，他们可能也生活在一个外层「模拟世界」中。

Jailbreaking the Simulation

如果我们确实生活在模拟世界中，或许我们可以在地球的某个地方找到一个后门——「Simulation Trapdoor」，从而获得「模拟器」的超能力，抽取出不可思议的「秘密知识」。

如果我们的世界的确是被程序模拟出来的，这个程序也许会有 Bug，如果有 Bug 存在，说不定我们可以利用这个 Bug 进行越狱，跳出「理想世界」，到达外面一层的世界中，与可爱的码农上帝聊一聊。

这是在开玩笑吗？下面摘自自知乎的一个段子[10]：

问题：「如果世界是虚拟的，有哪些实例可以证明？」。
回答：

为什么宏观上丰富多彩，但是微观的基本粒子却都是一模一样的？这正和图片富多彩，但是像素是一模一样的一回事

为什么光速有上限？因为机器的运行速度有限

为什么会有普朗克常量？因为机器的数据精度有限

为什么微观粒子都是几率云？这是为了避免系统陷入循环而增加的随机扰动

为什么有泡利不相容原理？看来系统采用的数据组织是多维数组

为什么量子计算机运行速度那么快，一瞬间可以尝试所有可能？因为这个本质上是调用了宿主机的接口

为什么会有量子纠缠？这实际上是引用同一个对象的两个指针

为什么会有观察者效应？这显然是lazy updating

为什么时间有开端？系统有启动时间

未完待续

设计一个密码学协议就好像在走钢丝，如果你想同时做到「零知识」和「可靠性」就意味着既要让协议内容充分随机，又要保证「知识」能够参与协议的交互。如果协议没有正确设计，亦或没有正确工程实现，都将导致系统安全性坍塌。比如可能破坏了零知性，导致「知识」在不经意间泄露；或者也许破坏了可靠性，导致任何人都能伪造证明。而且这种安全性，远比传统的代码底层机制漏洞来得更加严重，并且更难被发现。严格数学论证，这似乎是必不可少的。

我们的世界真的是某个「三体文明」模拟出来的吗？不能排除这个可能性，或许，我们需要认真地重新审视自己的各种执念。不过那又怎么样呢？至少自己的「思想」是真实的。

If you would be a real seeker after truth, it is necessary that at least once in your life you doubt, as far as possible, all things. 如果你是一个真正的真理探求者，在你人生中至少要有一次，尽可能地质疑所有的事情。 —— 笛卡尔

致谢：特别感谢 Shengchao Ding, Jie Zhang，Yu Chen 以及安比实验室小伙伴们(p0n1, even, aphasiayc, Vawheter, yghu, mr)的建议和指正。

参考文献

[1] zkPoD: 区块链，零知识证明与形式化验证，实现无中介、零信任的公平交易. 安比实验室. 2019.
[2] Hoffstein, Jeffrey, Jill Pipher, Joseph H. Silverman, and Joseph H. Silverman. An introduction to mathematical cryptography. Vol. 1. New York: springer, 2008.
[3] Schwartz–Zippel Lemma. Wikipedia. https://en.wikipedia.org/wiki/Schwartz%E2%80%93Zippel_lemma
[4] Damgård, Ivan. “On Σ-protocols.” Lecture Notes, University of Aarhus, Department for Computer Science (2002).
[5] Schnorr, Claus-Peter. “Efficient signature generation by smart cards.” Journal of cryptology 4.3 (1991): 161-174.
[6] Brown, Daniel RL. “Generic groups, collision resistance, and ECDSA.” Designs, Codes and Cryptography 35.1 (2005): 119-152.
[7] 笛卡儿, 徐陶. 第一哲学沉思集. 九州出版社; 2008.
[8] Bostrom, Nick. “Are we living in a computer simulation?.” The Philosophical Quarterly 53.211 (2003): 243-255.
[9] Nick Statt. “Comma.ai founder George Hotz wants to free humanity from the AI simulation”. Mar 9, 2019. https://www.theverge.com/2019/3/9/18258030/george-hotz-ai-simulation-jailbreaking-reality-sxsw-2019
[10] doing@知乎. “如果世界是虚拟的，有哪些实例可以证明？”. 2017. https://www.zhihu.com/question/34642204/answer/156671701

随机「挑战」

探索零知识证明系列（四）

“Challenges are at times an indication of Lord’s trust in you.” 挑战，有时是上天信任你的一种表现。― D. Todd Christofferson

本文继续长篇大论零知识证明背后的机制原理，希望帮助大家理解这一类「现代密码学工具」的大致轮廓。本文约8000字，少量数学公式。

交互与挑战

我们之前介绍的零知识证明系统都是「交互式」的，需要验证者 Bob 在交互中提供一个或若干个「随机数」来挑战，比如「地图三染色问题」（参看『系列二』）中，验证者 Bob 需要「不断地」随机挑选一条边来挑战 Alice 的答案，直到 Bob 满意为止，而 Alice 的作弊概率会「指数级」地衰减。而让 Bob 相信证明的「基础」取决于 Bob 所挑选的随机数是不是足够随机。如果 Alice 能够提前预测到 Bob 的随机数，灾难就会发生，现实世界就会退化成「理想世界」，而 Alice 就可以立即升级成「模拟器」，通过超能力来愚弄 Bob。

而『系列三』中，我们分析了 Schnorr 协议，协议中虽然验证者 Bob 只需要挑选一个随机数 c 来挑战 Alice ，让她计算一个值 z，但 Bob 绝对不能让 Alice 有能力来预测到 c 的任何知识，否则，Alice 也会变身成模拟器。

随机数的重要性不言而喻：

通过随机数挑战是交互式零知识证明的「信任根基」。

但，「交互过程」会限制应用场景。如果能将交互式零知识证明变成「非交互」？这会非常非常激动人心。所谓的非交互可以看成是只有「一轮」的证明过程，即Alice 直接发一个证明给 Bob 进行验证。

非交互式零知识证明，英文是 Non-Interactive Zero Knowledge，简称 NIZK。它意味整个证明被编码为一个「字符串」，它可以写到一张纸上，通过邮件、聊天工具等各种方式随意发送给任何验证者，字符串甚至可以放在 Github 上随时供大家下载验证。

在区块链世界，「NIZK」可以作为共识协议的一部分。因为一个交易需要多个矿工进行校验。设想下，如果交易的发送者和每个矿工都要交互一下，让矿工进行挑战，那么共识过程将奇慢无比。而非交互式零知识证明则可以直接广播给所有的矿工节点，让他们自行验证。

可能有朋友会问：只让一个矿工挑战不就够了吗？把矿工和交易发送者的交互脚本编码成证明，然后广播给其他矿工，然后其他矿工就直接相信这个挑战过程是可信的，不也可以吗？但是，很显然，这里需要相信第一个交互矿工作为可信第三方，第三方？似乎不是一个好主意……

而非交互式零知识证明，以下我们直接说「NIZK」，似乎就很理想了，没有第三方赚差价。

「非交互」带来的困惑

非交互式零知识证明，NIZK，如果存在，那么它要比交互式证明强大得多。

交互式证明，只能取信于一个验证者；而 NIZK 可以取信于多个验证者，以至所有人。
交互式证明，只能在交互的那个时刻有效；而 NIZK 将始终有效。

NIZK 不仅可以跨越空间，还能跨越时间

听上去很美，不是吗？But, ……

重复下上节的一个结论：

通过随机数挑战是交互式零知识证明的「信任根基」。

可是如果 NIZK 失去了挑战过程，有什么后果？

我们已经回忆过「零知识」性质的证明（参考『系列二』），证明过程需要构造一个模拟器（算法），它也和验证者（Bob）在理想世界中进行交互，而验证者 Bob 没有能力区分出来对方是否是真的 Alice 还是一个模拟器。

如果现在考虑下 NIZK 中的 非交互式，假如「我」向「你」出示一张纸，上面写着一个「真」证明 X ，又假如「你」在看过这张纸之后确实相信我了；又因为协议是「零知识」，那么如果把「我」换成一个模拟器，模拟器也能「伪造」一个假证明 Y，能够也让「你」相信。

好了，问题来了：

你如何区分 X 和 Y ，孰真孰假？当然你无法区分，因为协议是零知识的，你必须不能区分
我可以同样可以把 Y 出示给你看，那岂不是「我」就可以欺骗你了吗？

是不是不和谐了？请大家在此处思考两分钟。

(两分钟后……)

因为 NIZK 没有了交互，也就没了挑战过程，所有的证明过程都有 Alice 来计算书写，理论上 Alice 确实是想写什么就写什么，没人拦得住，比如 Alice 就写「理想世界」的假证明 Y。

想必深刻理解模拟器的朋友，在这里会发现一个关键点：模拟器必须只能在「理想世界」中构造Y，也就是说，Y 这么邪恶的东西只能存在于「理想世界」，不能到「现实世界」祸害人间。

继续思考……

还有一个更深层次的问题，请大家回忆下「地图三染色问题」，之所以模拟器不能在「现实世界」中为非作歹，核心原因是，他在理想世界中有「时间倒流」的超能力，而在「现实世界」中不存在这种黑魔法。现实世界的「不存在性」是关键。

而且，NIZK 中没有交互，于是导致了一个严重的后果，模拟器没有办法使用「时间倒流」这个超能力，当然似乎也就不能区分证明者在两个世界中的行为。

换句话说，如果我们面对任何一个 NIZK 系统，似乎「模拟器」就很难高高在上了，它好像只能飘落人间，成为一个普普通通的凡人。如果，我说如果，按此推论，假设模拟器不再具备超能力，那就意味着 Alice 和模拟器没有区别，Alice 也可以成为一个模拟器，再继续推论，Alice 就可以在「现实世界」中任意欺骗 Bob，那么这个证明系统就不再有价值，因为它失去了「可靠性」。结论：任何的 NIZK 都不可靠。

这一定是哪里出了问题……

上面我们在分析的过程中，提到了交互挑战的缺失。确实，如果 Bob 不参与 Alice 产生证明的过程，证明所包含的每一个 bit 都由 Alice 提供，似乎「证明」本身不存在任何让 Bob 信任的「根基」。这个从「直觉」上似乎说不通。

那是不是说，没有 Bob 的参与就「彻底」没办法建立「信任根基」了呢？信任的根基还可以从哪里来呢？

答案是「第三方」！

Wait ……，协议交互不是只有两方吗？ Alice 和 Bob，哪来第三方？

需要用特殊的方式引入第三方，而且方法不止一种，我们先研究第一种。

（泪目：不是说的好好的，咱们不引入第三方吗？）

回顾 Schnorr 协议

我们再看一下老朋友——Schnorr 协议，它是一个三步协议：第一步，Alice 发送一个承诺，然后第二步 Bob 发送随机数挑战，第三步，Alice 回应挑战。

我们来看，如何把一个三步的 Schnorr 协议变成一步。

看一下 Schnorr 协议的第二步，Bob 需要给出一个随机的挑战数 c，这里我们可以让 Alice 用下面这个式子来计算这个挑战数，从而达到去除协议第二步的目的。

c = Hash(PK, R)

其中 R 是 Alice 发给 Bob 的椭圆曲线点，PK 是公钥。大家可以好好看看这个利用 Hash 算法计算 c 的式子。这个式子达到了两个目的：

Alice 在产生承诺 R 之前，没有办法预测 c，即使 c 最终变相是 Alice 挑选的
c 通过 Hash 函数计算，会均匀分布在一个整数域内，而且可以作为一个随机数（注：请大家暂且这么理解，我们在后文再深入讨论）

请注意：Alice 绝不能在产生 R 之前预测到 c，不然， Alice 就等于变相具有了「时间倒流」的超能力，从而能任意愚弄 Bob。

而一个密码学安全 Hash 函数是「单向」的，比如 SHA256，SHA3，blake2 等等。这样一来，虽然 c 是 Alice 计算的，但是 Alice 并没有能力实现通过挑选 c 来作弊。因为只要 Alice 一产生 R， c 就相当于固定下来了。我们假设 Alice 这个凡人在「现实世界」中是没有反向计算 Hash 的能力的。

schnorr-nizk

看上图，我们利用 Hash 函数，把三步 Schnorr 协议合并为了一步。Alice 可以直接发送：(R, c, z)。又因为 Bob 拥有 PK，于是 Bob 可以自行计算出 c，于是 Alice 可以只发送 (R, z) 即可。

我们把上面这个方案稍微变下形，就得到了「数字签名」方案。所谓的数字签名，就是「我」向「你」出示一个字符串，比如「白日依山尽，黄河入海流」，然后为了证明这句诗是我出示的，我需要签署某样东西。这个东西能证明我的身份和这句诗进行了关联。

从 NIZK 角度看数字签名

不严格地说，数字签名方案相当于在证明（1）我拥有私钥，并且（2）私钥和消息进行了关联计算。

我首先要证明我的身份，那么这个简单，这正是 Schnorr 协议的功能，能够向对方证明「我拥有私钥」这个陈述。并且这个证明过程是零知识的：不泄露关于「私钥」的任何知识。

那么如何和这句唐诗关联呢？我们修改下计算 c 的过程：

m = "白日依山尽，黄河入海流"
c = Hash(m, R)

这里为了保证攻击者不能随意伪造签名，正是利用了离散对数难题（DLP）与 Hash 函数满足抗第二原象（Secondary Preimage Resistance ）这个假设。

注：这里严格点讲，为了保证数字签名的不可伪造性，需要证明 Schnorr 协议满足「Simulation Soundness」这个更强的性质。这点请参考文献[2]

上图就是大家所熟知的数字签名方案 —— Schnorr 签名方案[1]。在这里还有一个优化，Alice 发给 Bob 的内容不是 (R, z) 而是 (c, z)，这是因为 R 可以通过 c, z 计算出来。

注：为什么说这是一个「优化」呢？目前针对椭圆曲线的攻击方法有 Shanks 算法、Lambda 算法还有 Pollard’s rho 算法，请大家记住他们的算法复杂度大约都是 $O (n)$ [3]，n 是有限域大小的位数。假设我们采用了非常接近 2^256 的有限域，也就是说 z 是 256bit，那么椭圆曲线群的大小也差不多要接近 256bit，这样一来，把 2^256 开平方根后就是 2^128，所以说 256bit 椭圆曲线群的安全性只有 128bit。那么，挑战数 c 也只需要 128bit 就足够了。这样 Alice 发送 c 要比发送 R 要更节省空间，而后者至少需要 256bit。c 和 z两个数值加起来总共 384bit。相比现在流行的 ECDSA 签名方案来说，可以节省1/4 的宝贵空间。现在比特币开发团队已经准备将 ECDSA 签名方案改为一种类 Schnorr 协议的签名方案——muSig[4]，可以实现更灵活地支持多签和聚合。

而采用 Hash 函数的方法来把一个交互式的证明系统变成非交互式的方法被称为 Fiat-Shamir 变换[5]，它由密码学老前辈 Amos Fiat 和 Adi Shamir 两人在 1986 年提出。

重建信任 —— 随机预言精灵

前文提到，失去了挑战，似乎失去了证明的「信任根基」。而在 Schnorr 签名方案中，Hash 函数担负起了「挑战者」的角色，这个角色有一个非常学术的名字：「随机预言机」（Random Oracle）[6]。

可是这里为何用 Hash？实际上当 Alice 要产生公共随机数时，需要一个叫做「随机预言机」的玩意儿，这是什么？

开脑洞时间到！

我们设想在「现实世界」中，天上有一位「精灵」，他手持一个双栏表格，左边一栏为字符串，右边一栏为数字。任何人，包括你我，包括 Alice 和 Bob，都可以发字符串给「精灵」。

精灵在拿到字符串之后，会查表的左边栏，看看表格里有没有这个字符串，下面分两种情况：

情况一：如果左边栏找不到字符串，那么精灵会产生一个「真随机数」，然后把字符串与随机数写入到表格中，然后把随机数返回地面上的凡人。
情况二：如果左边栏有这个字符串记录，那么精灵会将右边栏里面的数字直接返回给地面。

大家会发现这个精灵的行为其实很像一个随机数发生器，但是又很不一样，不一样的地方在于当我们发送相同的字符串时，他会返回相同的数。这个精灵就是传说中的「随机预言机」。

而在合并 Schnorr 协议过程中，其实我们需要的是一个这样的随机预言精灵，而不是一个 Hash 函数。两者有什么不同的地方？区别就是：

随机预言机每次对于新字符串返回的是一个具有一致性分布的「真」随机数
Hash 函数计算的结果并不是一个真正具有一致性分布的随机数

那么为什么前面用的是 Hash 函数呢？这是因为在现实世界中，**真正的随机预言机不存在！**为什么呢？事实上，一个 Hash 函数不可能产生真的随机数，因为 Hash 函数是一个「确定性」算法，除了参数以外，再没有其它随机量被引入。

而一个具有密码学安全强度的 Hash 函数「似乎」可以充当一个「伪」随机预言机。那么合并后的安全协议需要额外增加一个很强的安全假设，这就是：

假设：一个密码学安全的 Hash 函数可以近似地模拟传说中的「随机预言机」

因为这个假设无法被证明，所以我们只能信任这个假设，或者说当做一个公理来用。插一句， Hash 函数的广义抗碰撞性质决定了它的输出可以模拟随机数，同时在很多情况下（并非所有），对 Hash 函数实施攻击难度很高，于是许多的密码学家都在大胆使用。

不使用这个假设的安全模型叫做「标准模型」，而使用这个假设的安全模型当然不能叫「非标准模型」，它有个好听的专有名词，叫做「随机预言模型」。

世界上有两种不同类型的人，喜欢甜豆花的，不喜欢甜豆花的。同样，世界上的密码学家分为两种，喜欢随机预言模型的，和不喜欢随机预言模型的[6]。

构造根基 —— 被绑架的精灵

Schnorr 协议经过 Fiat-Shamir 变换之后，就具有 NIZK 性质。这不同于我们证明过的 SHVZK，SHVZK 要求验证者诚实，而 NIZK 则不再对验证者有任何不现实的要求，因为验证者不参与交互，所谓要求诚实的验证者这个问题就不复存在。

注：如果验证者 Bob 不诚实会怎样？那么 Bob 有可能抽取出 Alice 的知识。但是对于三步 Schnorr 协议而言，它是否满足「零知识」，目前还处于未知状态。我们在系列三中只证明了它满足一个比较弱的性质：SHVZK。

但是，当 Schnorr 协议摇身一变，变成非交互零知识证明系统之后，就真正的「零知识」了。

然而，可能你的问题也来了，这个论断听起来似乎有道理，请问能证明吗？

时间到了，“翠花，上模拟器”

怎么用模拟器大法来构造一个「理想世界」呢？大家可以想一下，我们之前使用过「时间倒流」，还有修改「随机数传送带」超能力来让「模拟器」来作弊。可是没有交互了，这就意味着：「时间倒流」超能力不能用；Bob 的随机数传送带也不存在了，「篡改传送带」这个超能力也不能用！

但模拟器总要具备某种「超能力」，从而能够构建信任的「根基」

（如果模拟器在没有超能力的情况下具备作弊能力，那相当于证明了协议的不可靠性）。

可能大家现在已经猜出来了，模拟器要在「随机预言机」上动手脚。

先考虑下构造一个「理想世界」来证明「零知识」。在理想世界中，模拟器「绑架」了负责提供预言的「精灵」，当 Bob 向精灵索要一个随机数的时候，精灵并没有给一个真随机数，而是给 Zlice（模拟器假扮的 Alice）提前准备好的一个数（也符合一致性分布，保证不可区分性），「精灵」无可奈何地返回 Bob 一个看起来随机，但实际上有后门的数字。所谓后门，就是这个数字是 Zlice 自己提前选择好的。

第一步：Zlice 随机选择 z，随机选择c，计算 R'=z*G - c*PK 。

第二步：Zlice 将 c 与 (m, R') 写入精灵的表格。

第三步：Zlice 将签名 (c, z) 发送给 Bob。

第四步：Bob 计算 R=z*G - c*PK，并向精灵发送 (m, R)，精灵返回 c’。请注意，这里 Bob 计算出来的 R 和 Zlice 计算出来的 R' 是相等。

第五步：Bob 验证 c ?= c'，看看精灵传回来的随机数和对方发过来的随机数是否相等。如果相等，则验证签名通过；否则，则验证失败。

通过绑架「精灵」，Zlice 同样可以提前预知随机数，这和时间倒流能达到同样的效果。

我们已经证明了模拟器 Zlice 的「存在性」，于是我们上面已经证明了 NIZK。

接下来我们证明这个这个协议的「可靠性」。设想在另一个「理想世界」中，一个叫做「抽取器」的玩意儿，也同样绑架了精灵。当无辜 Alice 的向「精灵」索要一个随机数时，「精灵」返回了一个 c1，「抽取器」从精灵的表格中偷窥到了c1，当 Alice 计算出来 z1 之后，然后这时候「抽取器」仍然可以发动「时间倒流」超能力，让 Alice 倒退到第二步，再次向「精灵」要一个随机数，Alice 发送的字符串显然和第一次发送的字符串是相同的，(R, m)。按道理，因为 (R, m) 已经写在精灵表格的「左栏」里，所以一个诚实的「精灵」应该返回 c1。但是，「抽取器」绑架了精灵，他把表格中对应 (R, m) 这一行的「右栏」改成了一个不同的数 c2。当 Alice 计算出另一个 z2 之后，抽取器就完成了任务，通过下面的方程计算出 Alice 的私钥 sk：

sk = (z1 - z2)/(c1 - c2)

Fiat-Shamir 变换 —— 从 Public-Coin 到 NIZK

不仅仅对于 Schnorr 协议，对于任意的「Public-Coin 协议」，都可以用 Fiat-Shamir 变换来把整个协议「压缩」成一步交互，也就是一个非交互式的证明系统，这个变换技巧最早来自于 Amos Fiat 与 Adi Shamir 两人的论文『How to Prove Yourself: Practical Solutions to Identification and Signature Problems.』，发表在 1986 年的 Crypto 会议上[5]。也有一说，这个技巧来源于 Manuel Blum[6].

重复一遍，在 Public-coin 协议中，验证者 Bob 只做一类事情，就是产生一个随机数，然后挑战 Alice 。通过 Fiat-Shamir 变换，可以把 Bob 每一次的「挑战行为」用一次「随机预言」来代替。

而在具体实现中，随机预言需要用一个具有密码学安全强度的 Hash 函数（不能随便选，一定要采用密码学安全的 Hash），而 Hash 函数的参数应该是之前所有的上下文输入。下面是一个示例图，大家可以迅速理解这个 Fiat-Shamir 变换的做法。

前面提到，在非交互式证明系统中，需要引入一个第三方来构建信任的「根基」，使得 Bob 可以完全相信由 Alice 所构造的证明。在这里，第三方就是那个「精灵」，用学术黑话就是「随机预言」（Random Oracle）。这个精灵并不是一个真实存在的第三方，而是一个虚拟的第三方，它同时存在于「现实世界」与「理想世界」。在「现实世界」中，精灵是一个负责任的安静美男子，而在「理想世界」中，它会被「模拟器」绑架。

Public-Coin 协议还有一个好听的名字，「Arthur-Merlin 游戏」 ……

圆桌骑士

看上图，左边的“白袍”就是 Merlin（魔法师梅林），中间拿剑的帅哥就是 King Arthur（亚瑟王），两个角色来源于中世纪欧洲传说——亚瑟王的圆桌骑士。

Arthur 是一个不耐烦的国王，他随身携带一个硬币，而 Merlin是一个有着无限制计算能力的神奇魔法师，然后魔法师想说服国王相信某个「论断」为真，于是魔法师会和国王进行到对话，但是由于国王比较懒，他每次只会抛一个硬币，然后「挑战」魔法师，而魔法师需要及时应对，而且需要让国王在 k 轮之后能够相信自己的论断。由于 Merlin 有魔法，所以亚瑟王抛的硬币都能被 Merlin 看到[7]。

这与我们在『系列一』中提到的交互式证明系统（Interactive Proof System，简称 IP）有些神似，但又不同。IP 由 Goldwasser，Micali 与 Rackoff（简称GMR）在 1985 年正式提出，它的证明能力覆盖很大一类的计算复杂性问题。而不同的地方在于：在 IP 的定义中，证明者 Prover 和验证者 Verifier 都是可以抛硬币的图灵机，Verifier 可以偷偷抛硬币，并对 Prover 隐藏；而在 Arthur-Merlin 游戏中，国王只能抛硬币，不仅如此，而且抛硬币的结果总会被 Merlin 知道。

但是，Fiat-Shamir 变换只能在「随机预言模型」下证明安全，而用 Hash 函数实现随机预言的过程是否安全是缺少安全性证明的。不仅如此，「随机预言模型」下安全的协议可能是有不安全的，已经有人找到了一些反例[8]；更不幸的是，S. Goldwasser 与 Y. Tauman 在 2003 年证明了 Fiat-Shamir 变换本身也是存在安全反例的[9]。但是这并不意味着 Fiat-Shamir 变换不能用，只是在使用过程中要非常小心，不能盲目套用。

尽管如此，人们无法抵挡 Fiat-Shamir 变换的诱惑，其使用极其广泛。值得一提的是，最热的通用非交互零知识证明 zkSNARK 的各种方案中，Fiat-Shamir 变换比比皆是。比如大家可能耳熟能详的 Bulletproofs（子弹证明），此外还有一些暂时还不那么有名的通用零知识证明方案，比如 Hyrax，Ligero，Supersonic，Libra 等（我们后续会抽丝剥茧，逐一解读）。

小心：Fiat-Shamir 变换中的安全隐患

在 Fiat-Shamir 变换中，要尤其注意喂给 Hash 函数的参数，在实际的代码实现中，就有这样的案例，漏掉了 Hash 函数的部分参数：

比如在 A, Hash(A), B, Hash(B) 中，第二个 Hash 函数就漏掉了参数A，正确的做法应该是A, Hash(A), B, Hash(A,B) 。这一类的做法会引入严重的安全漏洞，比如在瑞士的电子投票系统 SwissPost-Scytl 中，就在 Fiat-Shamir 变换的实现代码中多次漏掉了本来应该存在的参数，导致了攻击者不仅可以随意作废选票，还可以任意伪造选票，达到舞弊的目的[10]。因此在工程实现中，请务必注意。

细心读者也许会回看一下 Schnorr 签名，大家会发现 Schnorr 签名中的 Hash 算法似乎也漏掉了一个参数 PK，并不是严格的 Fiat-Shamir 变换，这被称为 Weak Fiat-Shamir 变换[11]，不过这个特例并没有安全问题[3]，请未成年人不要随意模仿。

最近一些学者开始在标准模型下研究如何严格证明 Fiat-Shamir 变换的安全性，目前要么引入额外的强安全假设，要么针对某个特定协议进行证明，但似乎进展并不大。

交互的威力

话说在1985年，当 GMR 三人的论文历经多次被拒之后终于被 STOC’85 接受，另一篇类似的工作也同时被 STOC’85 接受，这就是来自于匈牙利罗兰大学的 László Babai，与来自以色列理工的 Shlomo Moran 两人撰写的论文『Arthur-Merlin Games: A Randomized Proof System, and a Hierarchy of Complexity Classes』[7]，引入了 Public-coin 交互式协议（顾名思义，Verifier 只公开抛硬币）。

国王 Arthur 的方法很简单，通过反复地「随机」挑战来检验 Merlin 的论断，这符合我们前面讲述过的直觉：采用随机挑战来构建信任的「根基」。Babai 在论文中证明了一个有趣的结论：AM[k]=AM[2]，其中 k 表示交互的次数，交互多次产生的效果居然和交互两次等价。所谓交互两次是指：Arthur 发一个挑战数，然后 Merlin 回应。

注：还有一类的问题属于 MA，这一类问题的交互顺序与 AM不同，MA中是 Merlin 先给出证明，然后 Arthur 抛硬币检验。已证明：MA 能处理的问题是 AM 的子集。

不仅如此，Babai 还大胆猜测： AM[poly] 与 IP 是等价的。这是一个神奇的论断：国王很懒，他只需要通过抛多项式次硬币，就能成功挑战魔法师，而这种方式的表达能力居然完全等价于 GMR 描述的交互式证明系统 IP。果不其然，在 STOC’86 会议上，来自 S. Goldwasser 与 M. Sipser 的论文证明了这一点，AM[poly] == IP[12]。

这意味着：反复公开的「随机挑战」威力无穷，它等价于任意的交互式证明系统。但是 AM[poly] 和别的计算复杂性类的关系如何，是接下来的研究热点。

三年后，1989 年11月底，距今恰好三十年，年轻的密码学家 Noam Nisan 发出了一封邮件，把自己的临时学术结论发给了几个密码学家，然后他就跑去南美洲度假了。可是他不曾想到，这一个邮件会引爆历史上一场激烈的学术竞赛，M. Blum, S. Kannan, D. Lipton, D. Beaver, J. Feigenbaum, H. Karloff, C. Lund 等等一大群精英开始加入战斗，他们没日没夜地互相讨论，并且竞相发布自己的研究成果，终于在12月26号，刚好一个月，Adi Shamir 证明了下面的结论：

AM[poly] == IP == PSPACE

image-shamir

它解释了「有效证明」这个概念的计算理论特征，并且解释了「交互式证明系统」这个概念所能涵盖的计算能力。

注：NP 类是 PSPACE 类的子集，前者大家比较熟悉，后者关联游戏或者下棋中的制胜策略[13]。

而 L. Babai 于是写了一篇文章，名为「Email and the unexpected power of interaction」（电子邮件与交互的始料未及的威力）[14]，详细阐述了这一整个月在「邮件交互」中精彩纷呈的学术竞赛，以及关于「交互证明」的来龙去脉。

公共参考串 —— 另一种「信任根基」

除了采用「随机预言机」之外，非交互零知识证明系统采用「公共参考串」（Common Reference String），简称「CRS」，完成随机挑战。它是在证明者 Alice 在构造 NIZK 证明之前由一个受信任的第三方产生的随机字符串，CRS 必须由一个受信任的第三方来完成，同时共享给 Alice 和验证者 Bob。

是的，你没看错，这里又出现了「第三方」！虽然第三方不直接参与证明，但是他要保证随机字符串产生过程的可信。而产生 CRS 的过程也被称为「Trusted Setup」，这是大家又爱又恨的玩意儿。显然，在现实场景中引入第三方会让人头疼。CRS 到底用来作什么？Trusted Setup 的信任何去何从？这部分内容将留给本系列的下一篇。

未完待续

非交互式零知识证明 NIZK 的「信任根基」也需要某种形式的随机「挑战」，一种「挑战」形式是交给「随机预言精灵」；另一种「挑战」是通过 Alice 与 Bob 双方共享的随机字符串来实现。两种挑战形式本质上都引入了第三方，并且两者都必须提供可以让「模拟器」利用的「后门」，以使得让模拟器在「理想世界」中具有某种「优势」，而这种优势在「现实世界」中必须失效。

NIZK 散发着无穷魅力，让我不时惊叹，在过去三十多年里，先驱们所探寻到的精妙结论，同时还有如此之多的未知角落，在等待灵感之光的照射。

本系列文章在 Github 上的项目仓库收到了第一个 Pull Request，来自Jingyu Hu(colortigerhu)，只改了个把字，但那一瞬间，我感受到了生命力。知识交流，思想碰撞，很迷人，不是吗？

“Everyone we interact with becomes a part of us.” 与我们交往互动的每一个人都是我们自身的一部分。 ― Jodi Aman

致谢：特别感谢丁晟超，刘巍然，陈宇的专业建议和指正，感谢安比实验室小伙伴们(p0n1, even, aphasiayc, Vawheter, yghu, mr) 的修改建议。

致谢：自Nisan发起的密码学研究轶事参考自邓老师的文章[15]。

参考文献

[1] Schnorr, Claus-Peter. “Efficient signature generation by smart cards.” Journal of cryptology 4.3 (1991): 161-174.
[2] Paillier, Pascal, and Damien Vergnaud. “Discrete-log-based signatures may not be equivalent to discrete log.” International Conference on the Theory and Application of Cryptology and Information Security. Springer, Berlin, Heidelberg, 2005.
[3] Pointcheval, David, and Jacques Stern. “Security arguments for digital signatures and blind signatures.” Journal of cryptology 13.3 (2000): 361-396.
[4] Maxwell, Gregory, Andrew Poelstra, Yannick Seurin, and Pieter Wuille. “Simple schnorr multi-signatures with applications to bitcoin.” Designs, Codes and Cryptography 87, no. 9 (2019): 2139-2164.
[5] Fiat, Amos, and Adi Shamir. “How to prove yourself: Practical solutions to identification and signature problems.” Conference on the Theory and Application of Cryptographic Techniques. Springer, Berlin, Heidelberg, 1986.
[6] Bellare, Mihir, and Phillip Rogaway. “Random Oracles Are Practical: a Paradigm for Designing Efficient Protocols.” Proc. of the 1st CCS (1995): 62-73.
[7] László Babai, and Shlomo Moran. “Arthur-Merlin games: a randomized proof system, and a hierarchy of complexity classes.” Journal of Computer and System Sciences 36.2 (1988): 254-276.m
[8] Canetti, Ran, Oded Goldreich, and Shai Halevi. “The random oracle methodology, revisited.” Journal of the ACM (JACM)51.4 (2004): 557-594.
[9] Shafi Goldwasser, and Yael Tauman . “On the (in) security of the Fiat-Shamir paradigm.” 44th Annual IEEE Symposium on Foundations of Computer Science, 2003. Proceedings.. IEEE, 2003.
[10]Lewis, Sarah Jamie, Olivier Pereira, and Vanessa Teague. “Addendum to how not to prove your election outcome: The use of nonadaptive zero knowledge proofs in the ScytlSwissPost Internet voting system, and its implica tions for castasintended verifi cation.” Univ. Melbourne, Parkville, Australia (2019).
[11] Bernhard, David, Olivier Pereira, and Bogdan Warinschi. “How not to prove yourself: Pitfalls of the fiat-shamir heuristic and applications to helios.” International Conference on the Theory and Application of Cryptology and Information Security. Springer, Berlin, Heidelberg, 2012.
[12] Goldwasser, Shafi, and Michael Sipser. “Private coins versus public coins in interactive proof systems.” Proceedings of the eighteenth annual ACM symposium on Theory of computing. ACM, 1986.
[13] Papadimitriou, Christos H. “Games against nature.” Journal of Computer and System Sciences 31.2 (1985): 288-301.
[14] Babai, László. “E-mail and the unexpected power of interaction.” Proceedings Fifth Annual Structure in Complexity Theory Conference. IEEE, 1990.
[15] Yi Deng. “零知识证明：一个略显严肃的科普.” https://zhuanlan.zhihu.com/p/29491567

埋藏「秘密」

Once exposed, a secret loses all its power. 一旦泄露，秘密就失去了全部威力 ― Ann Aguirre

这已经是本系列的第五篇文章了，这一篇继续深入非交互式零知识证明。本文约 12,000 字。

提纲

CRS 的前世今生
哈密尔顿环路问题
云中的秘密：Hidden Bits
升级随机性
FLS变换：从 Hidden Bits 到 NIZK
寻找理想的 Trapdoor Permutation
NIZK Proof vs. NIZK Argument
没有秘密的世界

追到这里的读者想必已对零知识证明有了一个大概的认识。你是否想过这个问题：零知识证明为何可行？这里请大家思考一下（比如系列一中的地图三染色问题的流程） …… （此处停留三分钟）下面两个要素似乎必不可少：

「交互」：验证者通过多次反复挑战，把证明者作弊概率降低到一个极小的值
「隐藏随机性」：验证者产生让证明者无法预测的随机数进行挑战

然而对于非交互式零知识证明—— NIZK 来说，如何实现上面两点？在系列四我们介绍了如何采用「随机预言机」来扮演一个虚拟的「第三方」角色，实现虚拟的「交互」与「随机挑战」。本文将深入讲述另一种方法，如何通过一段共享的字符串去除「交互」与「隐藏随机性」。这个字符串必须事先由「第三方」来随机产生，这就是传说中的「公共参考串」（Common Reference String，简称 CRS）。

CRS 的前世今生

假如我们不借助任何其它手段，限定证明者 Prover 和验证者 Verifier 只能进行「一次交互」来实现「零知识证明」，那么他们只能证明「平凡」问题，也就是计算复杂类 BPP（Bounded-error Probabilistic Polynomial time），而这个复杂度类大家一般猜想可能等价于 P（但还悬而未决，没有被证明！BPP 可以理解为 P + Randomness）。

注：如果 Prover 与 Verifier 只做一次交互，在这样的 NIZK 系统中，我们很容易能构造一个 Decision Procedure —— Verify(x, Sim(x))，来证明和证伪定理，因此只能证明平凡问题 BPP。

平凡问题虽然也可以零知识证明，但没有意义！怎么理解呢？因为验证者直接可以在多项式时间内根据「输出」求解出「秘密输入」，虽然验证者能够求解，但是「证明」本身并没有额外为验证者提供更多的「知识」。换句话说，不需要证明者出示证明，验证者就知道命题为真，于是证明过程也是零知识的。

因此，当我们讨论「零知识证明」时，要考虑带「知识」的 NP 类问题。大家都知道，P 问题是「确定性图灵机」多项式时间内可以求解的复杂类，它的执行路径对于输入 x是一个线性的状态转移。而 NP 问题是「不确定性图灵机」多项式时间可以求解的问题类。所谓的不确定性图灵机，就是它每次往前走一步是不确定的，有很多个选择，只要任何一个执行路径能到达终止状态，就表示它解决了该问题 x。换句话说，它的执行轨迹是一棵树。那么如果我们把不确定性图灵机每一步的路径选择记录下来（这个执行路径的记录叫做 witness，也就是我们反复提到的「知识」），那么把(x, witness)交给一个确定性图灵机，那么它也能在多项式时间内解决掉 x 问题。

再强调一下，「知识」能提高图灵机的解决问题的能力。

NP 问题中存在着不想「泄露」给验证者的知识 witness，这时，在一个交互式证明系统中，证明者和验证者在「知识」的掌握程度上是不对等的。

为了保证证明过程的「零知识」，我们需要保证：模拟器与验证者的不对等。可是，模拟器没有 witness啊，怎么能让他们不对等呢？上一篇我们介绍了「随机预言机」，我们通过允许让模拟器可以绑架「随机预言精灵」的方式制造不平等。本篇将讲述如何利用 CRS 来制造不平等。

CRS 是一个在证明之前就已经公开的，并且在证明者与验证者之间共享的，随机字符串。我们怎么来使用 CRS 呢？直觉上，一串双方都「知道」的信息，并不会增加「知识」不对等的情况。

首先大家会想，能不能直接用 CRS 作为随机挑战数呢？可不可以让 CRS 来代替「随机预言精灵」的角色？答案是不行！

为什么？这是因为 CRS 是在证明之前就已经产生了，如果证明者 Prover 提前知道了所有的随机挑战数，那么很显然这个随机挑战也就失去了意义。

注：请大家回想下「随机预言机」是如何保证证明者无法提前预测「随机挑战数」的？没想明白的你，请重读系列（四）。

CRS 的使命就是让「模拟器」与「验证者」不平等。怎么做呢？隐藏一些「秘密」进去。

如果进一步追问，隐藏了「秘密」有什么用呢？当然有用啦，在「理想世界」中，模拟器与抽取器才能很开心地玩耍起来（获取某些超能力） ……

1988年，Manuel Blum，Paul Feldman 和 Silvio Micali 三位先驱发表的论文「Non-Interactive Zero-Knowledge and Its Applications」（『非交互式零知识证明及其应用』[BFM88]）展示了「交互」与「隐藏随机性」的不必要性。他们给出了一个地图三染色问题的 NIZK 证明系统，在一段共享的随机产生的字符串（即CRS）的帮助下。

不过，……，我不会告诉你这个方案需要共享大概 n^4 超长的 CRS，其中 n是要证明的「命题」的长度。

1990 年，Uriel Feige，Dror Lapidot 与 Adi Shamir 三人提出了另一种构造 NP 语言的 NIZK 方案 [FLS90]。与 [BFM88] 不一样的是，这个 NIZK 方案不再基于特定的数论假设，而是基于一个密码学工具 Trapdoor Permutation。在这个方案中，FLS 提出了「隐藏比特」（Hidden Bits）的概念，然后把 Hidden Bits 藏入了 CRS。对于模拟器而言，就可以通过修改 CRS 中的 Hidden Bits 来达到模拟的效果，从而体现出对验证者 Verifier 的优越性。不过，这个方案需要共享更长的 CRS，超过 k * n^5，这里 k 是安全参数。

此后，Hidden Bits 的思路被很多人采用，值得一提的是，Kilian 与 Petrank 采用了一种更巧妙的方法来使用 Hidden Bits [KP98]（这里空间太小，写不下:），成功地把 CRS 的长度缩减到了 k * n^2。后来 J. Groth 继续优化，把 CRS 的长度缩小到了大约 k*n[Groth10a]。

除了 Hidden Bits，J. Groth，R. Ostrovsky 与 A. Sahai [GOS06] 使用了同态加密方案 Boneh-Goh-Nissim [BGN05] 或 Boneh-Boyen-Shacham 来实现 NIZK，他们把加密方案的「公钥」当做是 CRS，同时 Prover 加密作为证明，然后利用同态性质来证明另一个 NP-Complete 问题——布尔电路的可满足性问题。这个方案的最大优点，就是 CRS 长度是固定的，因为只是一个密钥而已，长度只有 k。对于模拟器而言，它可以通过超能力，拿到这个公钥所对应的陷门，从而能够实现密封任何信息，但得到相同的密文；对于抽取器而言，它可以用超能力拿到公钥对应的私钥，从而能够解密证明得到「知识」。

Jens Groth 在 2010 年基于 KEA（Knowledge of Exponent Assumption）假设与 Pairing 提出了一种新的 NIZK Arguments 方案[Gorth10b]，这也是后续许许多多 zkSNARKs 方案的起点。这里的 CRS 由一对对的（g^x^n, g^⍺x^n）构成，被用来实现「知识承诺」。其中 x 与 ⍺ 是两个随机数，在产生完 CRS 之后，必须被「遗忘」。有些人把这部分需要遗忘的随机数叫做「Toxic Wastes」，这容易误导读者。他们不仅无毒无害，而且非常有用。他们是被藏入 CRS 的「秘密」，是模拟器的武器。如果模拟器得到了 x 与 ⍺，就能伪造证明，从而保证证明的零知识。而对于抽取器，他能直接通过 KEA 假设内建的抽取函数来抽取知识。

最新的 Sonic 方案[MBK+19]又在 [Groth10b] 的基础上实现了 Updateable CRS。如果任何人担心 CRS 中的秘密已经被泄露了，他就可以在原有 CRS 基础上打一个补丁，继续往里藏一个秘密，这样就能保证 CRS 的安全性。这里的 CRS 还是「Universal 全局」的，即 CRS 只需要生成一次，就可以应付所有的命题证明。这个方案后续被最新的 Plonk[GWC19]，Marlin[CHMMVW19] 等方案采用。

接下来，我们就从一个简单的例子开始，理解如何基于 CRS 来构造 NIZK。在这之前，我们需要介绍一个 NP-Complete 问题——哈密尔顿环路问题。

哈密尔顿环路问题

想象出一个地图中有若干个城市，城市与城市间可以有公路。

假如给你一副地图，让你找出一条路径，不重复地走遍所有的公路（假设每条公路都是风景美如明信片的 Parkway，或许你想不重复地吃遍每条公路边上的麦当劳，出于某种情怀）。相信你会马上兴奋起来，这不就是小时候学过的「一笔画」么？判断一个地图能否一笔画，这是小学生做的数学题，我们可以计算每个城市连接的公路个数，根据奇偶性分成「奇点」与「偶点」。如果一个地图中存在两个奇点城市，那么你只能从一个奇点城市出发，遍历所有的公路，并且最终到达另一个奇点城市。这条路径就被称为「欧拉路径」（Euler’s Path）。

如果一个地图中所有的城市都是偶点，那么你可以从任意一个城市出发，轻松地找出一条路径，不重复地遍历所有的公路，并且回到起点。这个环路被称为「欧拉环路」（Euler’s Circuit）。

而如果地图存在超过2个以上的奇点，那么就不存在欧拉回路，比如著名的哥德斯堡七桥问题。

著名的哥德斯堡七桥问题就是这么描述，如果不重复地穿过下面七座桥。

哥德斯堡七桥地图显然存在多个奇点，不存在欧拉路径。如果给定任何一个地图，是否存在一个欧拉环路，这是一个 P 问题，也就是一个计算机可以在 poly(n) 多项式时间内寻找。

注：欧拉环路的寻找算法被称为 Fleury算法。

对于这样一个 P 问题，如果一个证明者 Prover 证明他知道一个欧拉回路，那么他可以直接发送回路的明文，然后验证者 Verifier 验证回路正确与否。请注意，这个过程仍然是零知识的。因为，Verifier 并没有通过 Prover 发送的信息获得任何 额外的知识。换句话说，Verifier 并没有因为看到回路，而增强了自身计算能力，因为 Verifier 本来就可以自行计算欧拉回路。

而我们要讲的是「哈密尔顿环路问题」则是一个 NP 问题，描述如下：

是否一个地图存在一个环路，能不重复地穿过每一个城市。

比如下面这张地图：

我们用一个矩阵 V * V 的矩阵来表示这个地图，凡是两个城市（A, B）有公路相连接，那么就在(A, B) 和 (B, A)里面填上 1，否则填 0。这个矩阵被称为「邻接矩阵」，我们可以把这个邻接矩阵拍扁，就变成了一个 0/1 比特串。

寻找「哈密尔顿环路」是一个 NP-Complete 问题，换句话说，不存在一个算法使得计算机在 poly(n) 多项式时间内找到环路。但是，计算机可以在多项式时间内检验一个路径是否是「哈密尔顿环路」。比如这个地图中就有一个带方向的哈密尔顿环路，我们一眼就能验证这个环路确实穿过了每一个城市。如果一个地图有哈密尔顿环路，那么它的矩阵一定是满足下面的特征：每一行一定有一个1，每一列一定也有一个1。

ZK-HAM 协议

我们下面给出一个三步交互的 Sigma 协议，Alice 向 Bob 证明她「知道」上面这个地图 G 的哈密尔顿环路。

公共输入：G 为一个有 6 个顶点的地图，表示为一个 6*6 的邻接矩阵
秘密输入：G的哈密尔顿环路 C（图中橙色的公路）

第一步：Alice 随机选择一个「置换」，Perm(.)，然后通过这个置换，产生一个新的图 G'；然后 Alice 把G' 矩阵的每一个单元加密，产生一个新的矩阵发送给 Bob。

【名词解释】：所谓置换，大家可以想象成用鼠标随意拖动图中的点，但是点和点之间的连线会跟着点一起被拖动，拖动结束之后形成的图，进行重新编号就得到 G'，比如上图左侧的两个图。经过置换变换的图前后是同构的。其中下图中，每一个顶点上角括号中的标号为拖动之前该顶点在上图中的编号。形式化一点可以这么定义：Perm()是一个 {1, V} 到 {1, V}的双射函数新图 G'的邻接矩阵，[perm(i), perm(i+1) ]=1 当且仅当 [i, i+1]=1，其中 i 是顶点编号，V 是顶点个数。

第二步：Bob 随机选择 b in {0, 1}} 进行挑战。

第三步情况（1）：Alice 根据 Bob 第二步发送的值：如果 b=0，那么 Alice 发送置换函数 Perm()，并且揭示完整的图 G'。而 Bob 则确认 G'是否是原图 G 经过置换无误。

第三步情况（2）：如果 Bob 第二步发送的b=1，那么 Alice 只揭示 G'中的哈密尔顿环路 C'即可。而 Bob 需要验证 C'是否是一个哈密尔顿环路

回忆一下三步 Sigma 协议，我们再理解下上面看似复杂的动作：

第一步：被称为 Commit，证明者 Alice 需要把手里的答案进行同态变换，产生一个新答案，然后把每一条边都锁起来，交给 Bob；
第二步：Bob 进行随机挑战；
第三步：Alice 根据 Bob 的随机挑战，做出两种不同的回应。如果 Bob 挑战 0，那么Alice 打开第一步的承诺，表示自己在第一步没有作弊；如果 Bob 挑战 1，那么 Alice 只解密暴露出哈密尔顿环路的边（公路），其它边则不需解密。Bob 可以轻易地检查地图上露出来的那些边是否构成了一个不重复地经过所有城市的环路。

如果这个 Sigma 协议只走一遍的话， Alice 作弊的概率是 50%，如果重复 n 遍，Alice 作弊概率会指数级减小。大家可以试着用「模拟器」和「抽取器」的方法来证明这个协议的「零知识」与「可靠性」。

ZK-HAM 的变形：ZK-HAM-2

接下来把上面的这个三步协议改动一下。大家先考虑下这样一个简单事实：如果一个仅包含环路的子图 C 是图 G的子图，C <= G那么说明 G 包含哈密尔顿环路。

这个事实等价于另一个事实：一个哈密尔顿图 G 的补集 !G 是环路子图 C 的补集 !C 的子图。

【名词解释】图的补集：所谓补集就是这样一个新地图，顶点保持不变，旧地图上的边在新地图中不存在，而新地图中的公路在旧地图中不存在，但是两个图重合在一起，就变成了一个完全图（完全图是指任意两个顶点之间都存在一条边）。

用邻接矩阵来理解，就是如果一个图G包含一个环路子图C，那么G矩阵中所有值为 0 的单元集合必然被 C矩阵中所有值为0的单元集合包含。可以表示为 !G <= !C。

根据第二个事实，我们可以定义如下的 Sigma 协议：

公共输入：图G ，表示为 6*6 的邻接矩阵
秘密输入：G的哈密尔顿环路 C（图中橙色的公路）

第一步：
- Alice 随机选择一个「置换」，Perm(.)，并且通过C构造一个哈密尔顿环路子图 C'=Perm(C)；
- 然后 Alice 加密 C'的每一个单元，把加密后的结果发送给 Bob。
第二步：Bob 随机选择 b in {0, 1}进行挑战

第三步情况（1）：如果 b=0，Alice 揭示完整的 C'，而 Bob 验证这个 C' 是否确实是一个哈密尔顿环路子图。

第三步情况（2）：如果 b=1，Alice 发送 Perm()，同时按照 G'=Perm(G)中的所有含 0 单元所在的位置，揭示 C'中所对应的单元；Bob 验证 C'所有被揭示单元是否全部为 0。

再理解下这三步 Sigma 协议：

第一步：证明者 Alice 需要把哈密尔顿子图 C 进行置换变换，产生一个新的哈密尔顿子图 C'，加密后交给 Bob；
第二步：Bob 进行随机挑战，0 或者 1；
第三步：如果 Bob 挑战 0，那么 Alice 打开第一步的承诺，展示一个带有唯一环路的图；如果 Bob 挑战 1，Alice 则按照 G'中的 0单元的位置打开承诺，展示承诺中被打开的位置全部为 0。

重点来了，大家仔细看看这个新版的 Sigma 协议的第一步。有没有发现什么情况？

第一步 Alice 发送的内容是与地图G无关的！

同样，第二步 Bob 发送的挑战也是与地图无关的。这样我们可以把第一步发的承诺改成事先准备好的比特串，而且我们假设这个比特串由一个可信第三方来产生，这样一来 Bob 就没有必要发送 b=0 这个分支，因为可信的第三方是诚实的，他一定是事先准备好一个正确的环路子图。这样，由于 Bob 只需要发送 1挑战分支，那么这一步也可以去除。

于是，三步协议变成了一步，我们成功去除了交互，有望实现 NIZK 。

我们接下来把 ZK-HAM-2 协议的第一步和第二步推到一个事先准备的字符串中，然后只让 Alice 发送第三步的内容给 Bob。如下图所示：

请注意，这里还不算是一个 NIZK 系统，因为这个共享字符串并不能对 Bob 公开，否则 Bob 就能算出环路 C。接下来，我们要解释一个新概念：「隐藏比特」（Hidden Bits）[FLS90]。Hidden Bits 是这样一串随机比特，它们对于验证者 Bob 隐藏，但是对于证明者 Alice 公开。然后在证明过程中，Alice 可以选择性地揭示一部分比特展示给 Bob 看。这是构造 NIZK 证明系统的一个利器，下面我们需要再继续深入 ……

云中的秘密：Hidden Bits

让我们再次开下脑洞，想象天上有朵云，云后面藏着一串随机产生的比特值，不是 0 就是 1，然后 Alice （证明者）带着一个「超级眼镜」，于是能够看到云后面所有的随机比特串，但是 Bob （验证者）却看不到。同时 Alice 手里还有一个「超级手电筒」，她可以打开手电筒用激光穿透云层，让 Bob 也能看见其中某个或某些比特。当然，Bob 能看到的比特的选择权完全在 Alice 手中。

云朵中隐藏的比特串就是所谓的 Hidden Bits。

接下来我们要通过 Hidden Bits 来完成一个单步交互，完成 ZK-HAM-2 协议的功能。在 ZK-HAM-2 中的第一步，Alice 产生一个随机的置换 Perm()，然后通过 G 中的哈密尔顿环路子图 C 产生一个变换后的环路子图 C'=Perm(C)。这等价于，事先由任何人产生一个随机的哈密尔顿环路子图 C'，然后 Alice 根据 C 和 C' 计算得出一个相应的 Perm()。

假设由某个「第三方」产生了一个随机的环路子图 C'，编码成「邻接矩阵」比特串，放到云朵后面。假设 V 为顶点（城市）的个数，E 为边（公路）的条数。这个邻接矩阵的编码需要一个 V*V 长度的比特串，可以解释成一个 V*V 的矩阵，其中每一行只包含一个 1，每一列也只包含一个 1，矩阵的其它单元都为 0。

接下来 Alice 如何构造证明呢？这其实很简单：

Alice 通过「超级眼镜」得到了一个随机的哈密尔顿环路子图 C'，然后计算得到一个置换 Perm()，使得 Perm(C)=C'。
Alice 根据 Perm() 来计算出一个换后的图 G'=Perm(G)
Alice 产生证明，由两部分组成：（1）置换Perm() （2）G'的邻接矩阵中所有值为 0 的单元坐标所对应的 C'矩阵的值，相当于 Alice 需要用「超级手电筒」给 Bob 揭示的隐藏比特。

那么 Bob 怎么验证这个证明呢？Bob 拿到证明之后，只需要检验两个东西：

Perm() 是否是一个合法的置换 V -> V，比如不能出现两个顶点映射到同一个顶点的情况。
对于 G 中的每一条「非边」，经过置换之后，Bob 抬头看天上对应的「隐藏比特」，比特值必须为 0

我们再仔细地深入理解下这个非交互协议。先从「完备性」入手：如果 Alice 没有作弊，那么很显然能够通过 Bob 的验证，这里请大家自行检查。

接下来我们分两步简要证明下「可靠性」：首先，因为 Bob 经过验证得知，所有 G 置换后的非边集合都已被揭示，且全为 0，那么可以得出结论，!G <= !C，即G的非边集合是环路子图 C的非边集合的子集。这等价于，C <= G，也就是说 G 包含一个哈密尔顿环路。这里请注意，这个可靠性概率是 100%。

然后，设想在一个「理想世界」中，Bob 获得了某种超能力（比如拿到 Alice 的「超级眼镜」），不需要 Alice 的超级手电筒，就能看穿云层，得到所有的隐藏比特 C'。然后当 Bob 得到 Perm()之后，就能通过 Perm() 反算出 C，于是 Bob 就相当于变身成了一个「抽取器」（Extractor），在理想世界中，它能把 Alice 要证明的知识给成功抽取出来。

那么怎么证明「零知识」呢？Alice 要具备一个超能力，就是在「理想世界」中，可以偷偷修改云朵中的隐藏比特。接下来就简单了，模拟器 Zlice 可以这么欺骗 Bob：

Zlice 把云朵中的隐藏比特全部置为 0
Zlice 随机产生一个合法的 Perm()

大家发现了，关键是，天上隐藏的比特必须是一个可信的字符串，所谓「可信」，就是指它确实应该是一个哈密尔顿环路子图。那么第三方需要可信。

可是，这样一个第三方是不是难以令人满意？Alice 和 Bob 要绝对信任他，不会和对手串谋。如果他和 Alice 串谋，可以把隐藏比特串直接设置为全 0；或者他和 Bob 串谋，直接把这个比特串给 Bob 看。这个协议看起来不错，但是很难实用。我们接下来要对这个简单协议进行升级。

升级随机性

第一个升级是让隐藏比特串变成一个「一致性均匀分布」的随机的隐藏比特串，是一个看起来相当随机的比特串，而不是一个刻意摆放好的哈密尔顿子图。

完全随机意味着比特串中的 0 的个数和 1出现的概率大概接近。那么接下来一个难题是如何让随机比特串中能出现一个随机的哈密尔顿环路子图矩阵。方法非常简单粗暴：产生一个足够长的随机串，然后从头扫描，直到找到一个随机的哈密尔顿环路为止。

可是……这个成功概率是不是非常非常小？我们下面给出一个概率没那么小的一种寻找方法。

我们先把比特串按照 5log(V) 的长度进行切分，然后如果每一个分片中的所有比特全为 1，那么我们把这个片段被视为邻接矩阵中的一个值为 1 的单元，否则视为一个值为 0 的单元。这样每一个矩阵单元出现 1 的概率为 1/(V^5)。
我们取连续的 V^6 个片段，构成一个 V^3 * V^3 的大矩阵。如果大矩阵中包含一个 V*V的哈密尔顿环路矩阵，并且其他单元（总共 V^6 - V^2个）都为 0。那么我们称这个大矩阵为「有用」。
根据概率计算，出现一个「有用」矩阵的概率为 1/[V^(3/2)]。

注：「有用」矩阵的概率计算过程请参考 Fact 4.10.8, 「Foundations of Cryptography, Vol I」by Oded Goldreich，P304。

好了，我们需要升级下上一节的协议。因为现在「隐藏比特串」被拆分成了若干个大矩阵，这些大矩阵有些是「有用」的，有些是没用的。

接下来 Alice 要来构造证明了，她先戴上超级眼镜，扫描云朵中的 Hidden Bits，这要分两种情况，

Case 1：如果 Alice 遇到了一个没用的大矩阵 M，Alice 公开 M 的所有单元。
Case 2：如果 Alice 遇到了一个「有用」的大矩阵 M，这意味着 Alice 得到了一个随机的哈密尔顿环路 C'，然后 Alice 参照上一节的步骤进行证明即可。

那么 Bob 怎么验证这个证明呢？我们还要分情况进行讨论，

Case 1：如果 Alice 公开了全部的 M，那么 Bob 就检查这个 M 是否「无用」。如果 M 无用，就认为证明有效；否则拒绝。
Case 2：如果 Alice 发送的是形如（Perm()，X）这样的证明，那么 Bob 按照上一节的验证方法进行验证。

对于这个协议，Bob 已经不再担心第三方是否作弊，故意产生一个全零的比特串，但是 Alice 仍然担心一旦第三方和 Bob 串谋，那么知识就彻底泄露了。

不仅如此，现在的协议还有个很强的限制，Alice 不能在看到隐藏比特之后再选择需要证明的 G，否则 Alice 就可以作弊。如果一个证明者选择证明的「命题」与 CRS 无关，那么这个证明者被称为 Non-adaptive Adversary。

FLS 变换：从 Hidden Bits 到 NIZK

接下来，我们再次升级协议，把「隐藏比特串」中的隐藏特性去除，变成「公共参考串」CRS。这里我们要借助一个密码学工具 —— Trapdoor Permutation，陷门置换。

所谓的陷门置换是指一个置换函数 F(x)，x是一个集合 S 中的元素，然后函数 F(x) 把x 映射到 S 中的另一个元素 y。同时 F(x) 满足单向性，即通过 y 很难反算出 x；但是如果谁拥有陷门 t，就能实现反向计算F^(-1)(t,y)=x。陷门置换还可以匹配一个 Hardcore Predicate，h(x)=0/1，它能根据 S 集合中的元素产生一个一致性分布的 0/1比特。介绍完毕，大家是不是有点晕，没关系，晕一晕就习惯了。总之一句话，陷门置换可以对公共参考串和Hidden Bits 进行相互转换。

先假设有这样的密码学工具，然后我们升级协议。

我们把公共参考串看成是一个列表，y1, y2, y3, ..., yn，列表中的每一项都是集合 S 中的元素。然后通过 Hardcore Predicate 产生 Hidden Bits 中的每一个比特位。但是请注意，这里不能直接通过 h(y)=b 来产生 Hidden Bits，因为这样一来 Bob 就能自己算出所有的 Hidden Bits，这违反了上一节的协议。为了保证对 Bob 隐藏，我们需要用公共参考串的原象，也就是 x1, x2, x3, ..., xn 来产生 Hidden Bits，h(x)=b。Bob 虽然不能自己计算 b1, b2, b3, ..., bn，但是一旦得到一个 x，他就能检验 F(x)?=y来判断是否 x 是和公共参考串对应，同时再计算 h(x)=b 得到被揭示的 Hidden Bits，b。

我们可以换一种不太准确，但是更直观的方式来理解，Alice 相当于自己产生一对公私钥。然后Alice 把公共参考串看成是一段「密文」，由于 Alice 有私钥，于是可以对密文进行解密，得到明文，这些明文，对于 Bob 而言就相当于是 Hidden Bits。当 Alice 要「揭示」Hidden Bits 时，就出示相应的明文片段，并且带上公钥，那么 Bob 就能通过公钥再次「加密」明文，与公共参考串的密文进行比对，确保 Alice 没有在揭示过程作弊。

下面是升级后的协议：

对于证明者 Alice：

Alice 随机选择一个 Trapdoor Permutation，(F, h, t)
根据公共参考串中的每一个 yi，利用陷门反向计算出 xi = F^(-1)(t, yi)
计算 Hidden Bits，bi=h(xi)
根据上一节的协议产生证明。假设 Alice 要揭示的 Hidden bits 的位置集合为 r1,r2,...,rl，那么 Alice 向 Bob 发送对应位置的 x，分别为 x_r1, x_r2, x_r3, ... x_rl ，连同(F, h)，和证明一起并发给 Bob。

对于验证者 Bob：

检查 (F, h) 是否为一个合法的 Trapdoor Permutation。
对 L 中的每一个元素 x_r，计算出被揭示的 Hidden Bits bi=h(F(x_r))，然后按照上一节的协议检查证明。

这个新协议的「完备性」，请大家自行检查。

对于「零知识」，我们需要构造一个「模拟器」Zlice2，它的超能力是修改公共参考串。

模拟器直接调用上一节协议的模拟器 Zlice。得到一个三元组，(proof, {r}, {b})
对于每一个公共参考串位置，如果它对应某一个 r，模拟器从集合 S 中随机选择一个 x_r，使得 h(x_r)=b_r，这里 b_r就是 {b}中对应 r ；然后把 y_r=F(x_r) 作为假参考串的一部分。
对于每一个公共参考串位置，如果与 {r}无关，那么模拟器随机选一个 y即可
模拟器把所有的 y拼在一起，得到一个假CRS。

对于「可靠性」，事情变得不那么简单了。因为现在 Alice 有能力挑选 (F,h,t)，Alice 可以挑选一个对自己有利，甚至作弊的 (F, h, t)，使得她可以控制一次协议运行的 Hidden Bits {b}的结果。对于本节升级后的新协议而言，需要重复很多遍，以致于虽然 Alice 可以控制一次协议运行的 Hidden Bits，但是她对其它若干次协议运行的 Hidden Bits 无能为力。换句话说，Alice 无论如何挑选 (F, h, t) 都无法完全掌控多次的协议运行。

这个升级变换理论上可以支持任意的 Hidden Bits 模型下的非交互式零知识证明，被称为 FLS Protocol。FLS 变换有很多的好处：首先，这个随机产生的 CRS 可以多次使用，实现所谓的「Multi-Theorem NIZK」；其次，可以实现「Adaptive Soundness」，即 Alice 可以先看到 CRS，然后再选择要证明的内容。最后，这个协议还是「Adaptive Zero-Knowledge」，即 Bob 也可以先看到 CRS，然后再选择要证明的内容给 Alice。

注：Adaptive Adversary 是比较符合现实世界的安全情况，比如第二类CCA安全。因为 CRS 是公开的，攻击者可以先分析 CRS，再决定如何发起攻击。

寻找理想的 Trapdoor Permutation

陷门置换 Trapdoor Permutation 最早出现在姚期智老师的论文「Theory and Application of Trapdoor Functions」[Yao82]中，是公钥密码学的重要基础。在上一节给出的 FLS 变换中，需要一个理想化的 Trapdoor Permutation，所谓的理想化是指，每一个 n-bit 字符串都能唯一变成另一个 n-bit 字符串，并且不会出现「多对一」的映射关系。Alice 需要随机抽样一个 Index，发给 Bob，然后 Bob 要能检查出这个 Index 所对应的 F() 是否是一个「完美」的置换。问题来了，怎么 Bob 怎么能在多项式时间内检查出来呢？如果 Bob 不能检查，那么 Alice 就可以抽样一个不完美的 Permutation（比如一个「多对一」的函数），从而可能作弊，破坏「Soundness」这个性质，Bellare 和 Yung 发表在 1996 年的论文最早注意到了这一点，但是并没有完全解决这个问题[BY96]。

如何找到一个桥梁，能够将 Trapdoor Permutation 合适地抽象出来，同时能够对接到密码学工具的实现上，是一个及其有挑战性的工作。随后各路密码学家（包括 Oded Goldreich）在这方面研究了很长时间，发表了许许多多的论文，各种不同类型的 Trapdoor Permutation 被定义、被研究，但是仍然不能让人满意。直到最近（2018年）一个工作是 Ran Canetti 与 Amit Lichtenberg 提出了 Certifiable Injective Trapdoor Function 这样一个新类型[RL18]，并证明了这种 Trapdoor Permutation 终于能满足 FLS 变换要求。但这是不是故事的结束呢？理论密码学家们估计不会停下探索的脚步。

除了基于 Trapdoor Permutation 的 FLS 变换，还有各式各样的解决方案来升级 Hidden Bits Model，比如采用 Invariant Signature[BG90]，或 Verifiable Random Generator [DN00] 来实现 Hidden Bits 的变换，或者弱可验证随机函数 [BGRV09]，还有一种叫做 publicly-verifiable trapdoor predicates 的方案[CHK03]。

三十年来，密码学家们发明的 NIZK 方案有很多，但 Hidden Bits 方法是目前已知唯一的办法，(1) 基于「一致性分布」的共享 CRS，(2) 实现任意 NP 语言的 NIZK Proofs（Not Arguments!）。

NIZK Proofs 与 NIZK Arguments

在本文中，我们构造的 NIZK 「证明」系统的可靠性属于「Statistical Soundness」，而零知识则属于「Computational Zero-Knowledge」。这意味着什么呢？这意味着，不管证明者 Alice 的算力有多强大（甚至超多项式），Alice 仍然无法作弊。但是，如果验证者 Bob 拥有超强的计算能力，那么是存在这种可能性：Bob 从证明中抽取到有价值的「知识」。

这又意味着什么？

这意味着，对于 NIZK Proofs 来说，它的长度肯定要比「知识」长，知识即 NP 问题中的 witness。只要 Bob 算力够强，他就可以把证明解密。对于「抽取器」而言，它也需要在没有交互的情况下抽取 witness 。证明最短的 NIZK Proofs 当属 Greg Gentry 等人采用「全同态加密」技术构造的 NIZK 方案了 [GGI+14]，证明长度只是稍稍大于 witness 的长度。

那能不能构造证明尺寸小于 witness 的 NIZK 呢？答案是 YES！

还有一类的 NIZK 系统被称为 NIZK Arguments：它们的可靠性是「Computational Soundness」，零知识属于「Perfect Zero-Knowledge」或者「Statistical Zero-Knowledge」。这说明，Alice 如果算力超强，那么她是有作弊空间的，但是因为现实世界中，我们可以通过加大安全参数（Security Parameters）来极大地降低 Alice 作弊的可能性，但是能实现非常极致的零知识特性。由于弱化了可靠性，那么我们就可以继续压缩证明的尺寸。

注：在本系列中，我们并不刻意区分「证明」与「论证」这两个词。如果需要指明 Arguments 而非 Proofs，会专门强调。

假如说我们要公开一个 NIZK 证明到 Github上，假如过了一百年以后，Github 网站还在，而未来计算机的计算能力已经有了质的飞跃，这时候，一个 NIZK Proof 可能会被算力攻破，泄露知识，而 NIZK Argument 则很大可能性上还保持安全性。

现在流行的热词 —— zkSNARK 中的 AR正是指代 Argument。

NIZK Argument 可以实现 O(1) 常数级长度的证明，即与 witness 的长度无关。然而这需要隐藏更多的秘密到 CRS 中。

没有秘密的世界

1956 年，哥德尔在一封寄给冯诺依曼的信中提到了一个著名的问题，「P 是否等于 NP」。后来，这个问题被 Clay 研究所列为七个千禧年难题之一，悬赏百万美金。

零知识证明系统正是为了保护 witness 不泄露的前提下，实现 NP 问题的验证。那如果一旦证明了「P == NP」，这会意味着什么？这意味着 witness 不再有多大意义了，反正一个图灵机也可以在多项式时间内找到 witness。零知识证明试图保护的 witness 也变得徒劳无益。

事实上，如果「P == NP」，现有的公钥密码学、对称加密 AES 与 SM4、哈希算法所依赖的难解问题都可能坍塌，我们可能很难保存秘密。不仅如此，

如果 P == NP，我们所处的世界将会变得非常不一样。「Creative Leaps」将不再有价值，求解问题与验证问题之间的鸿沟不复存在。每个能欣赏交响乐的人都会成为莫扎特，每个会推理的人都会变成高斯，每个能判断投资好坏的人都会变成巴菲特。从达尔文进化论的观点出发：如果这就是我们存在的宇宙，为什么我们还没有进化得可以充分利用这个好处？—— Scott Aaronson (2006)

对于数学也一样，数学证明的验证过程也是多项式复杂度的，如果「P == NP」，那么也就存在着多项式时间寻找证明的算法（如果证明存在）。这意味着哥德巴赫猜想、黎曼猜想将有可能得到证明，难怪 Lance Fortnow 在博客[For04]里这么说：

A person who proves P == NP would walk home from the Clay Institute not with one million-dollar check but with seven. 如果谁能证明 P = NP，那么他不会只拿着一张百万美元支票回家，而是七张。 —— Lance Fortnow (2004)

2002年的调查显示，61% 的计算机科学家相信「P != NP」，而十年后，这个比例上升到了 83%[Wil12]。而我是被 Scott Aaronson 的如下论断说服的：

自指论证：如果 P = NP 是事实，那么这个证明会比较容易被发现；但是如果 P != NP，那么这个证明会比较难发现。所以相信 P != NP 看起来会让 数学现实 更一致一些。—— Scott Aaronson (2006)

尽管是如此不情愿，如果我们真的生活在一个没有秘密的世界，那会是什么样子？「环形监狱 Panopticon」是 18 世纪英国哲学家 Jeremy Bentham 提出的一个惊悚概念。囚徒们被中心全天候监控，没有任何隐私可言，而且他们对自己是否处于被监控状态也无从得知。这个无比悲观的论调让人浑身不适，但很多人认为，这可能是两百多年前对未来网络数字时代的一则精准寓言。

从『Billy Budd』，卡夫卡的『The Trial』，到奥威尔的『1984』，到著名黑客 Kevin Mitnick 写的超级大卖书『隐形的艺术』（教你如何在大数据时代保护自己的信息），似乎，危机四伏，风险不断累积，对末日世界的想象给了作家们很好的素材 ……

偶尔无意中看到了一本有趣的漫画『The Private Eye』，它描述了一个劫后余生的后现代场景：在未来，我们的所有信息数据都存放在云上，然后突然有一天，这个数据云「爆炸」了，不知道是什么原因（可能是谁不小心打开了潘多拉的魔盒，找到了 P == NP 的构造性证明），反正所有的信息，包括每个人最阴暗的过去，都不再成为秘密；所有的数字化的资产都被抹掉，所有的在线知识库永久丢失；每个人的言行、账单、邮件、聊天消息、银行卡密码、中学考卷、GPS位置信息，写了一半的日记、删除的照片、上网记录，这些信息都将暴露给同事、邻居、朋友、亲人、甚至任何一个好奇的人。

每个人都无地自容，惶惶不可终日，然后逐渐地，大家都选择隐藏自己，人们出门都要戴上面具，以小心翼翼地保护自己的身份，甚至一个人可以选择使用多个身份，国家法律规定任何偷窥行为都将被严惩，获取信息成为了一种至少无上的权力，照相机需要被严格管控，互联网不再存在，人们通讯又回到了电话亭时代 ……

这会是人类的终极命运么？

未完待续

本文开头提到了「隐藏随机性」并不是必要的，我们来回想下 Hidden Bits 模型。这些 Hidden Bits 并没有对 Prover 隐藏，而是敞开了让 Prover 知道，但是由于 Hidden Bits 是「一致性随机分布」的字符串，所以即使让 Prover 知道了，他仍然逃不过随机挑战的火力。然而在流行的 zkSNARK 方案中，并没有采用「一致性随机分布」的 CRS，而是一组结构化的随机数。不管怎样，用 CRS 来构建「信任根基」的秘密，就是藏在其中的「秘密」。

这符合直觉，保守「秘密」也是一种信任。因为 Alice 不知道 CRS 中隐藏的秘密后门，所以无法作弊。同样，Bob 不知道 CRS 中的秘密，也就没办法获得「知识」。同样，人与人之间的协作既要建立在公开透明的基础上，也要保守秘密。

All human beings have three lives: public, private, and secret. 每个人都有三种生活，公开的，私人的，以及秘密的。—— Gabriel García Márqueel

致谢：感谢陈宇，丁晟超，张宇鹏，胡红钢，刘巍然，何德彪，万志国等老师的专业建议和指正，感谢安比实验室小伙伴（p0n1, even, valuka, Vawheter, yghu, mr）的修改建议。本文内容不代表他们观点。

最后附上漫画书的链接：http://panelsyndicate.com/comics/tpeye 作者甚至把创作过程的邮件和草图都放了出来，大家可以体验一下窥视制作过程的快感。

参考文献

[Aar06] Aaronson, Scott. Reasons to believe, 2006. https://www.scottaaronson.com/blog/?p=122
[BFM88] Blum, Manuel, Paul Feldman, and Silvio Micali. “Non-interactive zero-knowledge and its applications.” STOC’88. 1988.
[BG90] Bellare, Mihir, and Shafi Goldwasser. “New paradigms for digital signatures and message authentication based on non-interactive zero knowledge proofs.” Conference on the Theory and Application of Cryptology. Springer, New York, NY, 1989.
[BGN05] Boneh, Dan, Eu-Jin Goh, and Kobbi Nissim. “Evaluating 2-DNF formulas on ciphertexts.” Theory of Cryptography Conference. Springer, Berlin, Heidelberg, 2005.
[BGRV09] Brakerski, Zvika, Shafi Goldwasser, Guy N. Rothblum, and Vinod Vaikuntanathan. “Weak verifiable random functions.” In Theory of Cryptography Conference, pp. 558-576. Springer, Berlin, Heidelberg, 2009.
[BY96] Bellare, Mihir, and Moti Yung. “Certifying permutations: Noninteractive zero-knowledge based on any trapdoor permutation.” Journal of Cryptology 9.3 (1996): 149-166.
[CHK03] Canetti, Ran, Shai Halevi, and Jonathan Katz. “A forward-secure public-key encryption scheme.” International Conference on the Theory and Applications of Cryptographic Techniques. Springer, Berlin, Heidelberg, 2003.
[CHMMVW19] Chiesa, Alessandro, et al. Marlin: Preprocessing zksnarks with universal and updatable srs. Cryptology ePrint Archive, Report 2019/1047, 2019, https://eprint.iacr.org/2019/1047, 2019.
[DN00] Dwork, Cynthia, and Moni Naor. “Zaps and their applications.” Proceedings 41st Annual Symposium on Foundations of Computer Science. IEEE, 2000.
[FLS90] Feige, Uriel, Dror Lapidot, and Adi Shamir. “Multiple non-interactive zero knowledge proofs based on a single random string.” Proceedings [1990] 31st Annual Symposium on Foundations of Computer Science. IEEE, 1990.
[For04] Fortnow, Lance. “What if P = NP?”. 2004. https://blog.computationalcomplexity.org/2004/05/what-if-p-np.html
[For09] Fortnow, Lance. “The status of the P versus NP problem.” Communications of the ACM 52.9 (2009): 78-86.
[Groth10a] Groth, Jens. “Short non-interactive zero-knowledge proofs.” International Conference on the Theory and Application of Cryptology and Information Security. Springer, Berlin, Heidelberg, 2010.
[Groth10b] Groth, Jens. “Short pairing-based non-interactive zero-knowledge arguments.” International Conference on the Theory and Application of Cryptology and Information Security. Springer, Berlin, Heidelberg, 2010.
[GOS06] Groth, Jens, Rafail Ostrovsky, and Amit Sahai. “Perfect non-interactive zero knowledge for NP.” Annual International Conference on the Theory and Applications of Cryptographic Techniques. Springer, Berlin, Heidelberg, 2006.
[GWC19] Gabizon, Ariel, Zachary J. Williamson, and Oana Ciobotaru. PLONK: Permutations over Lagrange-bases for Oecumenical Noninteractive arguments of Knowledge. Cryptology ePrint Archive, Report 2019/953, 2019.
[KP98] Kilian, Joe, and Erez Petrank. “An efficient noninteractive zero-knowledge proof system for NP with general assumptions.” Journal of Cryptology 11.1 (1998): 1-27.
[MBK+19] Maller, Mary, et al. “Sonic: Zero-Knowledge SNARKs from Linear-Size Universal and Updateable Structured Reference Strings.” IACR Cryptology ePrint Archive 2019 (2019): 99.
[RL18] Ran Canetti and Amit Lichtenberg. “Certifying trapdoor permutations, revisited.” Theory of Cryptography Conference. Springer, Cham, 2018.
[Wil12]Gasarch, William I. “Guest Column: The Third P=? NP Poll.” ACM SIGACT News 50.1 (2019): 38-59.
[Yao82] Yao, Andrew C. “Theory and application of trapdoor functions.” 23rd Annual Symposium on Foundations of Computer Science (sfcs 1982). IEEE, 1982.

从零开始学习 zk-SNARK

作者：Maksym Petkus

翻译 & 注解：even@安比实验室（even@secbit.io）

校对：valuka@安比实验室

本系列文章已获作者中文翻译授权

翻译原链接

核心要点

加密函数： $E (v) = g^{v} (m o d p)$

在同态加密中:

模数 $p$ 是双方都知道的。它通常是写在加密代码中的

生成元 $g$ 是一个整数，作为一个基用来生成一系列的数字(密钥，用来对数据进行加密)

$v$ 就是我们要加密的值

如果上述核心要点已经模糊/忘记的话, 就通读全文

证明的媒介

这里我们先不要去管零知识，非交互性，其形式和适用性这些概念，就从尝试证明一些简单的东西开始。

想象一下我们 (Prover) 有一个长度为10 的位数组，现在要向 verifier（例如，程序）证明这样一个陈述：我的所有的位都被设置成了 1

verifier 一次只能检查（读）一位。为了验证 Prover 的这个陈述，verifier 以某种任意的顺序读取元素并检查其是否确实等于 1 。如果第一次抽样检查的结果是 1，就设置「陈述」的可信度为 ⅒= 10％，否则，如果等于 0，就说明「陈述」是错误的。

验证者继续进行下一轮验证，直到获得足够的可信度为止。假如在一些场景下要信任 prover 需要至少 50% 的可信度，那就意味着必须执行 5 次校验。但假如在其它一些场景下需要 95% 的可信度，就需要检查所有的元素。很明显这个证明协议的缺点是: 必须要根据元素的数量进行检查，如果我们处理数百万个元素的数组，这么做是不现实的。

现在我们来看一下由数学方程式表示的多项式，它可以被画成坐标系上的一条曲线：

上面的曲线对应多项式: f(x) = x³ – 6x² +11x– 6。多项式的阶数取决于 x 的最大指数，当前多项式的阶数是 3

多项式有一个非常好的特性，就是如果我们有两个阶为 d (比如 3 ) 的不相等多项式，他们相交的点数不会超过 d ( 3 个)。例如，稍微修改一下原来的多项式为 x³ – 6x² + 10x– 5 （注意 , 修改了多项式的最后一个系数，6 改成了 5 ）并在图上用绿色标出：

这一点微小的修改就产生了变化很大的曲线。事实上，我们不可能找到两条不同的曲线，他们会在 某段区域内重合（他们只会相交于一些点）。

要找到多项式与 x 轴的交点（即 f(x) = 0），我们就要令 x³ – 6x² + 11x – 6 = 0，等式的解就是和 x 轴的交点： x= 1 ，x= 2 和 x= 3。即图上蓝色曲线和 x 轴相交的地方。

同样，我们也可以令上文中原始的多项式和修改后的多项式相等，找到它们的交点:
联立 : x³ – 6x² + 11x – 6 = x³ – 6x² + 10x – 5 , 得到: $x - 1 = 0$

即这两个多项式有一个交点。

任意一个由阶数为 d 的多项式组成的等式，最后都会被化简为另外一个阶数至多为 d 的多项式，这是因为等式中没有能够用来构造更高阶数的乘法。例如：5x³ + 7x² – x + 2 = 3x³ – x² + 2x– 5，简化为 2x³ + 8x² – 3x + 7 = 0。阶数最多就是 3 (次方)

另外代数的基本原理也告诉我们，对于一个阶数为 d 的多项式最多有 d 个解，至多有 d 个共同点。

所以我们可以得出结论，任何多项式在任意点的计算结果（更多关于多项式求值参考：[Pik13]）都可以看做是其唯一身份的表示。

如果一个 prover 声称他知道一些 verifier 也知道的多项式（无论多项式的阶数有多大）时，他们就可以按照一个简单的协议去验证：

verifier 选择一个随机值 $x$ 并在本地计算多项式结果
verifier 将 $x$ 值丢给 prover，让他计算该多项式的结果
prover 代入 x 到多项式计算并将结果给到 verifier
verifier 检查本地的计算结果和 prover 的计算结果是否相等，如果相等那就说明 prover 的陈述具有较高的可信度

例如，对于一个 $d$ 阶多项式 , prover 如果不知道该多项式的 d 个解 , 如果把 x 的取值范围定在 1 到 $1 0^{77}$ , 那么 x 偶然“撞到”这 d 个结果相同的点中任意一个的概率就等于： $\frac{d}{1 0 ^{77}}$ （可认为不可能）

与低效的位检查协议相比，新的协议只需要一轮验证就可以让声明具有非常高的可信度（前提是假设 $d$ 远小于 x 取值范围的上限 (是低阶多项式)，可信度几乎是 100%）

这也是为什么即使可能存在其他的证明媒介，多项式依然是 zk-SNARK 核心的部分

even@安比实验室: 这一节告诉了我们多项式的一个重要性质：我们不可能找到共享连续段的两条不相等曲线，也就是任何多项式在任意点的计算结果都可以看做是其唯一身份的表示。也就是说只要能证明多项式上的某个随机点就可以证明这个多项式（只有在知道了多项式，才能算出这个点对于的值），这个性质是我们下面所有证明的核心。

这就是 Schwatz-Zippel 定理，它可以扩展到多变量多项式，即在一个多维空间内形成一个曲面。这个定理会在多个零知识证明方案的证明中反复出现。

问题 :

到目前为止，我们的协议还只是一个很弱的证明，因为协议中并没有采取任何措施去保证参与方必须按照协议的规则生成证明，所以参与方只能互相信任。

例如，prover 并不需要知道多项式，也可能通过其它方式得到正确的答案 (比如偷一个答案)。

而且，如果 verifier 要验证的多项式的解的取值范围不够大，比如我们前文说的 10，那个就可以去猜一个数字，猜对答案的概率是不可忽略不计的。因而我们必须要解决协议中的这个缺陷，在解决问题之前首先来想一下，知道多项式意味着什么呢？

多项式可以用下面的形式来表示（其中 n 指的是多项式的阶）： $c_{n} x^{n} + \dots\dots + c_{1} x^{1} + c_{0} x^{0}$ 假设证明者声称他知道一个包含 x=1 和 x=2 两个解的三阶多项式 , 满足此条件的一个有效的多项式就是 $x^{3} - 3 x^{2} + 2^{x} = 0$ 。

多项式的「知识」就是多项式的系数。所谓「知道」多项式就是指「知道」多项式的系数

因式分解

代数的基本定理表明了任意的一个多项式只要它有解，就可以将它分解成线性多项式（即，一个阶数为 1 的多项式代表一条线），因此，我们可以把任意有效的多项式看成是其因式的乘积： $(x - a_{0}) (x - a_{1}) \dots (x - a_{n}) = 0$

也就是说如果任意一个因式为 0，那么整个等式都为 0，也就是说式子中所有的 $a_{s}$ 就是多项式的所有解 $x^{3} - 3 x^{2} + 2 x = (x - 0) (x - 1) (x - 2)$

所以这个多项式的解（ $x$ 的值）就是：0，1，2，在任何形式下多项式的解都可以很轻松的被验证，只不过因式的形式可以让我们一眼就看出这些解（也称为根）

我们再回到前面的问题， prover 宣称他知道一个阶数为 3，其中两个根分别为 1 和 2 的多项式，也就是说这个多项式的形式为： $(x - 1) (x - 2) \cdot \dots (x - 1) (x - 2) \cdot \dots$ 换句话说 $(x - 1)$ 和 $(x - 2)$ 是问题中多项式的两个因式。

因而如果 prover 想要在不揭示多项式的前提下证明他的多项式确实有这两个根，那么他就需要去证明他的多项式 $p (x)$ 是 $t (x) = (x - 1) (x - 2)$ 和一些任意多项式 $h (x)$ （例子中 $x - 0$ ）的乘积，即： $p (x) = t (x) \cdot h (x)$

$t (x) = (x - 1) (x - 2)$ 也称为目标多项式 target polynomial

换句话说，存在一些多项式 $h (x)$ 能使 $t (x)$ 与之相乘后等于 $p (x)$ ，并由此得出， $p (x)$ 中包含 $t (x)$ ，所以 $p (x)$ 的根中也包含 $t (x)$ 的所有根，这也就是我们要证明的东西. 算出 $h (x)$ 的方式最自然的就是直接相除： $h (x) = \frac{p ( x )}{t ( x )}$

如果一个 prover 不能找到这样一个 $h (x)$ 也就意味着 $p (x)$ 中不包含因式 $t (x)$ ，那么多项式相除就会有余数

例如我们用 p(x) = x³ – 3x² + 2x 除以 t(x) = (x – 1)(x – 2) (即 x² – 3x+ 2 )

注意：左边的式子是分母，右上角的是计算结果。底部是余数（多项式相除的解释及示例可以看这里 [Pik14] ）。

我们算出结果 $h (x) = x$ ，没有余数。

_注意：为简化起见，后面我们会用多项式的字母来代替计算结果，如： $p = p (r)$

多项式可以被因式分解成它的根的因式的乘积。这个性质就意味着，如果一个多项式有某些解，那么它被因式分解后的式子中一定包含这些解的因式。有了这个性质，我们就可以愉快地去做一些证明啦。

利用多项式一致性检查协议我们就可以比较多项式 p(x) 和 t(x) ⋅ h(x)：

verifier 挑选一个随机值 $r$ , 计算 $t = t (r)$ (即，求值) ，然后将 $r$ 发送给 prover。
prover 计算 $h (x) = p (x) / t (x)$ ，并对 p(r) 和 h(r) 进行求值，将计算结果 p, h 提供给 verifier。
verifier 验证 $p = t \cdot h$ ，如果多项式相等，就意味着 t(x) 是 p(x) 的因式。

实践一下，用下面的例子来执行这个协议：

verifier 选一个随机数 23，并计算 t = t(23) = (23 – 1)(23 – 2) = 462，然后将 23 发给 prover
prover 计算 $h (x) = p (x) / t (x) = x$ , 并对 p(r) 和 h(r) 进行求值，p= p(23) = 10626，h = h(23) = 23，将 p 和 h 提供给 verifier
verifier 再验证 $p = t \cdot h$ ：10626 = 462 ⋅ 23 是正确的，这样陈述就被证明了。

相反，如果 prover 其实不知道真正的 $p (x)$ , 而是使用了一个不相干的 $p^{'} (x)$ ，如 p′(x) = 2x³ – 3x² + 2x ，它并不包含必需的因式, 那么：

prover 计算 $h (x) = p^{'} (x) / t (x)$ , 运算出结果 $2 x + 3$ 和余数 $7 x -6$ ： $p (x) = t (x) \cdot (2 x + 3) + 7 x - 6$
为了计算出结果 , prover 不得不冒险用余数除以 $t (x)$ ，即
$\frac{p ( x )}{t ( x )} = h (x) = \frac{t ( x ) \cdot ( 2 x + 3 ) + 7 x -6}{t ( x )} = 2 x + 3 + \frac{7 x - 6}{t ( x )}$

不过由于 x 是 verifier 随机选择的，只有极低的概率余数 $7 x -6$ 可以被 $t (x)$ 整除。如果后面 verifier 要另外再检查 p 和 h 必须是整数的话，这个证明就会被拒绝。

如此校验就同时要求多项式系数也是整数，这对协议产生了极大的限制

这就是为什么接下来我们要介绍能够使余数不被整除的密码学原理的原因，尽管这个原始值是有可能被整除的。

Remark 3.1 现在我们就可以在不知道多项式的前提下根据特定的性质来验证多项式了，这就已经给了我们一些零知识和简明性的特性。但是，这个结构中还存在好多问题：

prover 可能并不知道他所声称的 $p (x)$ ，
- 因为 prover 知道随机点 $x = r$ ，他可以先算一下 $t = t (r)$ ，然后选择一个随机值 $h$ ，由此计算出 $p = t \cdot h$ 。因为等式是成立的，所以也能通过 verifier 的校验。
- 因为 prover 知道随机点 $x = r$ ，他可以构造出一个任意的多项式，这个任意多项式与 $t (r) \cdot h (r)$ 在 $r$ 处有共同点。
在前面的「陈述」中，prover 声称他知道一个特定阶数的多项式，但现在的协议对阶数并没有明确的要求。因而 prover 完全可以拿一个满足因式校验的超级高阶数的多项式来欺骗 verifier

下面我们就要来逐一得解决这些问题。

even@安比实验室：利用因式的性质构造出了一个证明协议，但这个协议存在一些缺陷，主要是由于

一旦 prover 知道了 $t (r)$ ，他就可以反过来任意构造任何一个可以整除 $t (r)$ 的 $p (r)$

有的公司的 $t (r)$ 就直接写在开源代码里面 …. 作死 ….

prover 知道了点 $(r, t (r) \cdot h (r))$ 的值，就可以构造经过这一点的任意(高次)多项式，同样满足校验

协议并没有对 prover 的多项式阶数(次数)进行约束

模糊计算

Remark 3.1 中的前 2 个问题是由于 暴露了原始值 而导致的，即 $P$ 知道了 $r$ 和 $t (r)$ 但如果 verifier 给出的这个 $r$ 值像放在黑盒里一样不可见的话就完美了，也就是一个人即使不破坏协议，也依然能在这些模糊的值上面完成计算。有点类似哈希函数，从计算结果就很难再回到原始值上

同态加密

这也就是要设计同态加密的原因。它允许加密一个值并在密文上进行算术运算。获取加密的同态性质的方法有多种，我们来介绍一个简单的方法。

总体思路就是我们选择一个基础的（基数需要具有某些特定的属性）的自然数 g（如 5），然后我们以要加密的值为指数对 g 进行求幂。例如，如果我们要对 3 进行加密：

$5^{3} = 125$

这里 125 就是 3 对应的密文。如果我们想要对被加密的值乘 2，我们可以以 2 为指数来对这个密文进行计算。 $12 5^{2} = 15625 = (5^{3})^{2} = 5^{2 \times 3} = 5^{6}$

我们不仅可以用 2 来乘以一个未知的值并保持密文的有效性，还可以通过密文相乘来使两个值相加，例如 3+2：

$5^{3} \cdot 5^{2} = 5^{3 + 2} = 5^{5} = 3125$

同样的，我们还可以通过相除提取加密的数字，例如：5-3

$\frac{5 ^{5}}{5 ^{3}} = 5^{5} \cdot 5^{- 3} = 5^{5 - 3} = 5^{2} = 25$

不过由于基数 5 是公开的，很容易就可以找到被加密的数字。只要将密文一直除以 5，直到结果为 1，那么做除法的次数也就是被加密值的数。

比如有一段密文是 125 , 那么 $125/5/5/5 = 1$ , 除了 3 次得到 1 , hacker 自然知道加密值是 3 , 这毫无加密可言, 所以我们需要 Mod 模运算

模运算

这里就到了模运算发挥作用的地方了。模运算的思路如下：除了我们所选择的组成有限集合的前 n 个自然数（即，0，1，…，n-1）以外，任何超出此范围的给定整数，我们就将它“缠绕”起来。例如，我们选择前六个数。为了说明这一点，可以把它看做一个有六个单位大小相等刻度的圆；这就是我们所说的范围（通常指的是有限域）。

现在我们看一下数字八应该在哪里。打个比方，我们可以把它看成一条长度为 8 的绳子。

如果我们将绳子固定在圆圈的开头

然后用绳子缠绕圆圈，我们在缠完一圈后还剩下一部分的绳子。

然后我们继续缠绕，这根绳子将在刻度 2 的地方终止。

这就是模运算操作的结果。无论这根绳子多长，它最终都会在圆圈一个刻度处终止。因而模运算结果将保持在一定范围内（例子中是 0 到 5）。长度为 15 的绳子将会在刻度 3 的地方终止，即 6 + 6 + 3 （缠 2 个完整的圈并剩下 3 个单位长的部分）。

负数运算类似，唯一不同的地方就是它是沿相反方向缠绕的，如 -8 的取模结果是 4。

我们执行算术运算，结果都将落在这 n 的范围内。现在开始我们将用符号 “mod n” 来表示这个范围内的数。

3 × 5 = 3 mod 6

5 + 2 = 1 mod 6

另外，模运算最重要的性质就是运算顺序无所谓。

例如，我们可以先做完所有的操作，然后再取模，或者每操作完一步都去取模。例如 (2 × 4 – 1) × 3 = 3 (mod 6) 就等于：

2 × 4 = 2 mod 6

2 - 1 = 1 mod 6

1 × 3 = 3 mod 6

那么模运算到底有什么用呢？就是如果我们使用模运算，从运算结果再回到原始值并不容易，因为不同的组合会产生一个同样的运算结果：

5 × 4 = 2 mod 6

4 × 2 = 2 mod 6

2 × 1 = 2 mod 6

……

设想一下 , 如果没有模运算的话，计算结果的大小会给找出原始值提供一些线索。

除非这里既能把信息隐藏起来，又可以保留常见的算术属性。

强同态加密

我们再回到同态加密上，使用模运算，例如取模 7，我们可以得到：

$5^{1} = 5 (5 m o d 7 = 5)$

$5^{2} = 4 (25 m o d 7 = 4)$

$5^{3} = 6 (125 m o d 7 = 6)$ …………

其中在某些不同的指数下运算得到了同样的结果 , 比如 $5^{5} / 5^{11} / 5^{17}$ 模7 的运算结果都是 3 ：

$5^{5} = 3 (m o d 7)$

$5^{11} = 3 (m o d 7)$

$5^{17} = 3 (m o d 7)$ ……

这样就很难知道指数是多少了。事实上，如果模取得相当大，从运算结果倒推指数运算就不可行了； 现代密码学很大程度上就是基于这个问题的“困难”。

而方案中所有的同态性质都在模运算中保留了下来：

$e n cry pt i o n : 5^{3} = 6 (m o d 7)$
- 根据密文 6 , 不能推出原文 3
$m u lt i pl i c a t i o n : 6^{2} = (5^{3})^{2} == 5^{6} = 1 (m o d 7)$
$a dd i t i o n : 5^{3} \cdot 5^{2} = 5^{5} = 3 (m o d 7)$
- 根据密文 3 , 无法推出私钥

(原文)注意：模相除有点难 , 超出范围了, 这里不表。

我们来明确地说明一下加密函数： $E (v) = g^{v} (m o d n)$

$v$ 是想要加密的值

模数 $n$ 是双方都知道的, 它通常写在加密代码中

生成元 $g$ 是一个整数，作为一个基用来生成一系列的数字比如 $g^{v}$

$g^{v}$ 通常称为密钥，用来对数据进行加密

Remark 3.2 : 这个同态加密模式有一个限制，我们可以将 加密值 乘以 未加密值 ，但不能将两个已经加密的值相乘( we cannot exponentiate an encrypted value)（或者相除），也就是说我们不能对加密值取幂。

在同态加密中，求幂运算会破坏同态的性质，导致加密后的数据无法被正确解密。因此，同态加密不允许对已经加密值进行再次的求幂运算。 Besides, 密文之间的乘法操作可能会泄露有关明文的信息。特别是在某些强同态加密方案中，如果不小心执行操作，可能会导致信息泄露。

虽然这些性质第一感觉看起来很不友好，但是这却构成了 zk-SNARK 的基础。这个限制后面将在“加密值乘法 (Multiplication of Encrypted Values) ”一节中讲到。

通过模运算形成的集合被称为「有限域」，

通过计算指数再进行模运算形成的集合构成「循环群」。

常见的同态加密方式除了整数幂取模之外，还有椭圆曲线上的倍乘。

加密多项式

配合这些工具，我们现在就可以在加密的随机数 x 上做运算并相应地修改零知识协议了。

我们来看一下如何计算多项式 p(x) = x³ – 3x² + 2x。

我们前面明确了，知道一个多项式就是知道它的系数，也就是这个例子中知道：1, -3, 2。

因为同态加密并不允许再对加密值求幂，所以我们必须要给出 x 的 1 到 3 次幂取加密值：E(x)，E(x²)，E(x³)，那么我们要计算的加密多项式就是：

$E (x^{3})^{1} \cdot E (x^{2})^{- 3} \cdot E (x)^{2} = (g^{x^{3}})^{1} \cdot (g^{x^{2}})^{- 3} \cdot (g^{x})^{2} = g^{1 x^{3}} \cdot g^{- 3 x^{2}} \cdot g^{2 x} = g^{x^{3} - 3 x^{2} + 2 x}$

所以通过这些运算，我们就获得了多项式在一些未知数 $x$ 处的加密计算结果。这确实是一个很强大的机制，因为同态的性质，同一个多项式的加密运算在加密空间中始终是相同的

我们现在就可以更新前面版本的协议了，比如对于阶数为 d 的多项式： $E (v) = g^{v} (m o d n) (放着备用)$

协议过程

前面提到 : Prover 想要在不揭示多项式的前提下证明他的多项式确实有这两个根，他需要去证明他的多项式 $p (x)$ 是 $t (x) = (x - 1) (x - 2)$ 和一些任意多项式 $h (x)$ 的乘积，即： $p (x) = t (x) \cdot h (x)$ $t (x) = (x - 1) (x - 2)$ 也称为 target polynomial

协议过程如下 :

Verifier

Verifier 自己取一个随机数 $s$ ，作为秘密值
多项式指数 $i$ ( $x^{i}$ )取值为 0，1，…，d 时分别计算出 $s$ 的 $i$ 次幂的加密结果，即： $E (s^{i}) = g^{s}^{i}, i \in (0.. d)$ (注意是 $g^{s}$ 的 $i$ 次方)
代入 $s$ 自己计算未加密的 target poly $t (x)$ , $t (s)$ 留作验证备用
将对 $s$ 的幂的加密值丢给 prover: $E (s^{0}), E (s^{1}), .., E (s^{d})$ , 即 $g^{s^{0}}, g^{s^{1}}, \dots, g^{s^{d}}$
- 看起来, 目前 Verifier 知道 $P (x)$ 的阶数 $d$

Prover :

Prover 想证明它确实有这 2 个根 ( 即有 $t (x)$ 因式) :
Prover 自己计算多项式 $h (x) = p (x) / t (x)$
使用 Verifier 给的加密值 $g^{s^{0}}, g^{s^{1}}, \dots, g^{s^{d}}$ , 和自己的 $p (x)$ 的系数 $c_{0}, c_{1}, .., c_{n}$ 计算 $E (p (s))$ :
$E (p (s)) = g^{p (s)} = (g^{s^{d}})^{c_{d}} * \dots * (g^{s^{1}})^{c_{1}} * (g^{s^{0}})^{c_{0}} = g^{(s^{d} \cdot c_{d} + \dots + s^{1} \cdot c_{1} + s^{0} \cdot c_{0})}$
同样计算 $E (h (s)) = g^{h (s)}$
将结果 $g^{p}$ (即 $g^{p (s)}$ ) 和 $g^{h}$ (即 $g^{h (s)}$ )提供给 verifier

注: $E (v) = g^{v} mod n$ 是加密函数

Verifier

最后一步是 Verifier 校验 $p g^{p} g^{p} = ? t (s) \cdot h 即 = ? (g^{h})^{t (s)} => = ? g^{t (s) \cdot h}$ 就能知道 Prover 到底是否有根 ; 为什么呢 ?
- 注 : $g^{p}$ 和 $g^{h}$ 是 Prover 传的 , $t (s)$ 是 Verifier 自己算的 ;
因为如果 $g^{p} = (g^{h})^{t (s)}$ 成立 (即 $g^{p} = g^{t (s) \cdot h}$ 成立) , 根据同态性质 , 即 $p (x) = t (s) \cdot h$ 成立 , 就说明 Prover 真的有多项式的解

问题: Prover 计算 $E (h (s)) = g^{h (s)}$ , s 是 Prover 不知道的, 那如何计算 $h (s)$ 呢 ?
1. 郭师: $s^{0}, s^{1}, s^{2}$ 是一组 mod 过的 key-value , 是双方都知道的 2. 使用的是 $g^{s^{0}}, g^{s^{1}}, \dots, g^{s^{d}}$ 而不是 $s$ 原值 3. ∵ $h (x) = h_{0} + h_{1} x + h_{2} x^{2} + \dots + h_{n} x^{n}$
4. ∴ $h (s) = h_{0} \cdot [s^{0}] + h_{1} \cdot [s^{1}] + h_{2} \cdot [s^{2}] + \dots + h_{n} [s^{n}]$

注意：g 是公开的, 双方都知道的因为证明者并不知道跟 s 相关的任何信息，这就使得他很难提出不合法但是能够匹配验证的计算结果。

尽管这个协议中 prover 的灵活性有限，他依然可以在实际不使用 verifier 所提供的加密值进行计算，而是通过其它的方式来伪造证明。例如，如果 prover 声称有一个满足条件的多项式它只使用了 2 个求幂值 $s^{3}$ 和 $s^{1}$ ，这个在当前协议中是不能验证的

even@安比实验室: 利用强同态加密这个工具，构造了一个相对较强的零知识证明协议。但是如上文所述，这里还是存在一些问题—— 无法验证 prover 是否是真的使用了 verifier 提供的值 $g^{s^{0}}, g^{s^{1}}, \dots, g^{s^{d}}$ 来构造证明的。

ref (IF 图挂了)

https://secbit.io/blog/2019/12/25/learn-zk-snark-from-zero-part-one/
https://learnblockchain.cn/article/287

作者：Maksym Petkus

翻译 & 注解：even@安比实验室（even@secbit.io）

校对：valuka@安比实验室

本系列文章已获作者中文翻译授权

翻译原链接

Restricting a Polynomial (限制多项式)

上文说到 :

多项式的知识其实就是它的系数 $c_{0}, c_{1}, \dots, c_{i}$ 的知识
上文的协议无法验证 prover 是否是真的使用了 verifier 提供的值 $g^{s^{0}}, g^{s^{1}}, \dots, g^{s^{d}}$ 来构造证明

协议中, 我们通过对秘密值 s 的幂的加密值再进行求幂来对系数进行“赋值”。我们已经限制了 prover 对 s 幂的加密值的选择, 但是这个限制并不是强制的 ，也就是说，prover 可以使用任何可能的方法找到满足下面等式的值 $z_{p}$ 和 $z_{h}$

$Z_{p} g^{Z_{p}} V v er i f i es g^{p} = (Z_{h})^{t (s)} m e an s = g^{Z_{h}}^{t (s)} e q u a t i o n i s s a t i s f i e d = ? g^{t (s) \cdot h}$

https://arxiv.org/pdf/1906.07221.pdf

再用寻找到的 $z_{p}$ 和 $z_{h}$ 来代替 $g^{p}, g^{h}$ 交给 verifier。 verifier 还是验证 $g^{p} = ? g^{t (s) \cdot h} 即 g^{Z_{p}} = ? g^{Z_{h}}^{t (s)}$ 是否成立 , 自然成立, 此时 $P$ cheat 成功

所以 verifier 需要能够知道 prover 给出的 $g^{p}, g^{h}$ 就是用 s 幂的加密值 $g^{s^{0}}, g^{s^{1}}, \dots, g^{s^{d}}$ 计算的, 而不是其它值算的

来看一个简单例子: 由 1 个变量和及其系数组成的一阶多项式 : $s$ 对应的加密值为 $E (s) = g^{s}$ 。这里我们要做的就是确保 prover 是拿 $s$ 的加密值 $g^{s}$ ，而不是其他值与其系数 c 做同态相乘的。所以结果一定是这个形式（c 为任意值）： $(g^{s})^{c}$ 解决这个问题的一种方法就是用另一个“变换”的加密值做同样的操作，充当类似算术中“校验和”（Checksum） 的作用，以此确保结果是原始值的求幂值。

这个是通过 Knowledge-of-Exponent Assumption (简称 KEA) 方法来实现的，在 Dam91 中有介绍，更精准一点（注意 $a$ 和 $α$ 2 个字符的不同）说：

Alice 有一个值 $a$ ，她想要 Bob 对其进行任意指数的求幂（ $a$ is a generator of a finite field group used），唯一的要求是 Bob 只能对 $a$ 进行求幂，为保证这一点，Alice 要：

选择一个随机数 $α$
计算 $a^{'} = a^{α} (mod n))$
提供一个元组 $(a, a^{'})$ 给 Bob, 然后让他对这 2 个值执行任意的求幂运算，返回结果元组 $(b, b^{'})$ ( The α-shift remains the same. i.e. $b^{'} = b^{α} (mod n)$ )

因为 Bob 无法从元组 $(a, a^{'})$ 中提取 $α$ 的值 (暴力破解也难以实现)，那么 Bob 只能老老实实地生成有效元组 $(b, b^{'})$ ：

Bob 选择一个值 $c$ ( $c$ 可以类比上例的 $p, h$ )
计算 $b = (a)^{c} (mod n)$ 和 $b^{'} = (a^{'})^{c} = (a^{α})^{c} (mod n)$
返回 $(b, b^{'}) = (a^{c}, a^{α c})$

有了 Bob 回复的 $(b, b^{'})$ 和自己的 $α$ ，Alice 就可以验证等式：

$(b)^{α} = b^{'}$
$(a^{c})^{α} = (a^{'})^{c} = (a^{α})^{c}$
$a^{c \cdot α} = (a^{α})^{c}$

结论是：

Bob 在元组的两个值的计算上都用了同一个指数（即 $c$ ）
Bob 只能用 Alice 原本的元组 $(a, a^{'})$ 来保持 α-shift
构造验证值 $(b, b^{'})$ 的唯一方式是用同一个指数 $c$
Alice 并不知道 $c$ ，这和 Bob 不知道 $α$ 的原因一样
虽然 c 是被加密的，但它的可能取值范围并不足够大到保持其零知识的性质，这个问题我们将在后面“零知识”那一节解决。

最后这个协议提供了一个证明给 Alice ，Bob 确实是用他知道的某个值对 $a$ 进行求幂的，而且他也不能做别的任何操作，例如：乘法，加法，因为这样就会破坏 α-shift (α-变换关系)

在同态加密中，求幂是对被加密值进行乘法运算。我们可以应用这个结构到一个简单的系数多项式 $f (x) = c \cdot x$ 的例子中：

verifier 选择随机数 $s, α$ ，然后令 $x == s$ , 提供一阶及其 “shift” 的计算值： $g^{s}, g^{α \cdot s}$
prover 代入其私有的系数 $c$ 计算: $((g^{s})^{c}, (g^{α s})^{c}) = (g^{cs}, g^{α cs})$
verifier 验证： $(g^{cs})^{α} = g^{α cs}$

这个结构“限制” prover 只能用 verifier 提供的加密的 $s$ 进行计算，因而 prover 只能将系数 $c$ 赋给 verifier 提供的多项式。

现在我们可以扩展这种单项式(monomial) 上的方法到多项式上，因为计算是先将每项的分配分开计算然后再 “同态地” 相加在一起的（这个方法是 Jens Groth 在 Gro10 中介绍的）。

所以如果 $V$ 给 $P$ 一个 $s$ 的幂及其加密 shifted ， $P$ 就可以计算原始的和 shift 后的多项式，, where the same check must hold. 对于阶数为 $d$ 的多项式：

verifier : 提供加密值 $g^{s^{0}}, g^{s^{1}}, \dots, g^{s^{d}}$ 和他们的 α-shift $g^{α s^{0}}, g^{α s^{1}}, \dots, g^{α s^{d}}$ prover :

计算给定的带有 $s$ 的幂的 encrypted polynomial : $g^{p (s)} = (g^{s^{0}})^{c_{0}} \cdot (g^{s^{1}})^{c_{1}} \dots\dots (g^{s^{d}})^{c_{d}} = g^{(c_{0} s^{0} + c_{1} s^{1} + \dots + c_{d} s^{d})}$
evaluates encrypted “shifted” polynomial with the corresponding α-shift of the powers of $s$ : $g^{p^{'}} = g^{α p (s)} = (g^{α s^{0}})^{c_{0}} \cdot (g^{α s^{1}})^{c_{1}} \cdot \dots \cdot (g^{α s^{d}})^{c_{d}} = g^{c_{0} α s^{0} + c_{1} α s^{1} + \dots + c_{d} α s^{d}} = g^{α \cdot (c_{0} s^{0} + c_{1} s^{1} + \dots + c_{d} s^{d})}$
将计算结果 $g^{p}, g^{p^{'}}$ 发给 verfier

verfier 校验 : $(g^{p})^{α} = ? g^{p^{'}}$

前面的多项式例子 $x^{3} - 3 x^{2} + 2 x$ 就变成了：

现在我们就可以确保 prover 是用了 verifier 提供的多项式而不是其它值做计算的了，因为别的方法不能够保持 α-shift 变换。当然如果 verifier 想要确保在 prover 的多项式中排除了 $s$ 的某些次幂，如 $j$ ，他就不提供对应的密文及其变换： $g^{s^{j}}, g^{s^{α j}}$

与前面的协议相比，我们现在已经有了一个比较健壮的协议。但是尽管已经做了加密，在 零知识 性质上也还依然存在一个很明显的缺陷：

即即使理论上多项式参数 $c_{i}$ 是一个很广的取值范围内的值，在实际中, 这个范围可能很有限（比如前例中的 6），这就意味着 verifier 可以在有限范围的系数组合中进行暴力破解，获取 $P$ 的知识 , 最终计算出一个与 $P$ 的答案相等的结果 :

比如 $V$ 将每个系数的取值范围定为 100，多项式阶数为 2，那么大概只会有 100 万种不同的组合，可以认为 $V$ 暴力破解 $P$ 的密钥只需要少于 100 万次的迭代

更重要的是，对于一个安全的协议, 即使在只有 1 个系数，值为 1 的例子中，安全协议也必须能够保证其安全 !!!

even@安比实验室: 有了 KEA，就可以约束 prover 只能通过用 verifier 提供的加密值去构造证明了。严格点讲，这里是用的是 KEA的扩展版本，叫做 The q-power Knowledge of Exponent Assumption.

Zero-Knowledge

上文说到 $V$ 能从 $P$ 发送的数据中暴力破解 $p (x)$ ，来看一下 those provided values (the proof) : $g^{p}, g^{p^{'}}, g^{h}$

双方都参与到了下面的 checks ：

$g^{p} = (g^{h})^{t (s)}$ (poly $p (x)$ has roots of $t (x)$ )
$(g^{p})^{α} = g^{p^{'}}$ (poly of a correct form is used)

问题是我们如何更换(一种新的)证明 (alter the proof) 使得这些 checks 依然有效，同时又保证没有知识能被提取？

Chap-1 给了一个提示：我们可以使用随机值 $δ$ (delta)来 “shift” 这些值, 如 $(g^{p})^{δ}$
现在，为了提取知识，就必须首先要知道一个不可知的值 δ。并且，这种随机化在统计学上与随机值没有什么区别。 (原文: in order to extract the knowledge, one first needs to find δ which is considered infeasible(不可行的). Moreover, such randomization is statistically indistinguishable from random.)

为了保持这种关系，我们在 $V$ 的 checks 中验证一下。等式的每一边都有 prover 提供的值 $δ$ , 如果我们用 $δ$ 来“变换” 每一个值，那么等式应该可以保持相等

Concretely (具体来讲)，就是 prover 选择一个随机值 $δ$ ，并用它对证明中的值进行求幂 (and exponentiates his proof values with $δ$ ) $(g^{p (s)})^{δ}, (g^{h (s)})^{δ}, (g^{α p (s)})^{δ}$

不要怕, $g^{p (s)}, g^{h (s)}, g^{α p (s)}$ 我们在前面都已经见过了

and provides to the $V$ for verification: $(g^{p})^{δ} = ((g^{h})^{δ})^{t (s)} l ik e g^{p} = (g^{h})^{t (x)} ((g^{p})^{δ})^{α} = (g^{p^{'}})^{δ} l ik e (g^{p})^{α} = g^{p^{'}}$ 合并一下(consolidation), 可以看到校验的等式依然成立 (the check still holds) : $g^{δ \cdot p} = g^{δ \cdot t (s) h} g^{δ \cdot α p} = g^{δ \cdot p^{'}}$

注意零知识是如何轻而易举地融入到这个结构中去的，这通常也被称为“无成本的”零知识

even@安比实验室: 借助这个”无成本的”技巧，就可以轻松实现 zero-knowledge 了。但是这里实现零知识的方法和实际中的 Pinocchio 协议，还有 Groth16 方案略有不同。实际方案中是用乘法乘以 $g^{δ \cdot t (s)}$

Non-interactivity & Distributed Setup

到现在为止，我们已经讲完了一个交互式的零知识方案。但为什么我们还需要有非交互式呢？因为交互式证明只对 original $V$ 有效，其他任何 $V$ 都不能信任这个 proof，因为：

$V$ 可以和 $P$ 串通，告诉 $P$ secret params $s, α$ ，有了这些参数 $P$ 就肆意伪造 proof 来四处行骗
$V$ 也可以使用同样的方法自己伪造 proof
$V$ 必须保存 $α$ 和 $t (s)$ 直到所有相关证明被验证完毕，这就带来了一个可能造成秘密参数泄漏的额外攻击面 (which allows an extra attack surface with possible leakage of secret parameters)

因而 $P$ 就需要分别和每次每个 $V$ 都做交互来证明一个 statement（该多项式的知识）

尽管 交互式证明 有它的用处，例如一个 $P$ 只想让一个特定的 $V$ （称为目标 verifier，更多的信息参见 JSI96 ）确信，就不能再重复利用同一个证明去向别人证明这个声明了，但是当一个 prover 想让众多的参与者同时或者永久地确信的话，这种方法就很低效了。 prover 需要保持一直在线并且对每一个 verifier 执行相同的计算。

因而，我们就需要一个可以被重复使用，公开，可信，又不会被滥用的秘密参数

Pairing: Multiplication of Encrypted Values

Cryptographic pairings (bilinear map) is a mathematical construction, denoted as a function $e (g^{*}, g^{*})$

它被给予一个数据集中的 2 encrypted inputs (e.g. $g^{a}, g^{b}$ ) , 可以将他们确定性地映射到另一组不同的输出数据集上的它们的乘积，即 $e (g^{a}, g^{b}) = e (g, g)^{ab}$

因为源数据集和输出数据集（通常被称为一个 group ）是不同的，所以一个配对的结果不能用做其他配对计算的输入。我们可以将输出集（也称为“目标集”）视为“不同的宇宙”。因而我们不能用另一个加密值乘以结果，而且配对这个名称本身也表明了，我们一次只能将两个加密值相乘

even@安比实验室: 换句话说，配对只支持 x * y 这种两个值的乘法，但不支持三个或以上的值相乘，比如不支持 x * y * z

Pairing 类似于一个 $ha s h$ ，将所有可能的输入值映射到可能的输出值的集合中的一个元素上，通常情况下这个过程是不可逆的

注意：乍一眼看过去，这个限制可能会阻碍相关功能的实现，但在 zk-SNARK 中这反而是保证安全模式的最重要性质，参见前文 remark 3.3

配对函数 $e (g^{*}, g^{*})$ 可以初步（and technically incorrect）类比(mathematical analogy) 成: “交换(swap)” 每一个输出的基数(base) 和指数(exponent) 的操作，使得基数 $g$ 在交换过程中被修改成了指数的方式，即 $g^{a} \to a^{g}$ , “被转换”的两个输入一起被修改了，这样原始值 $a$ 和 $b$ 就在同一个指数下相乘了，即：

e(g^\textcolor{red}{a},g^\textcolor{red}{b}) =a^g \cdot b^g =(\textcolor{red}{ab})^g

因而因为基数(base) 在“转换”中被修改了，所以在另一个配对中不能再使用这个结果 $(ab)^{g}$ （即： $e ((ab)^{g}, g^{d})$ ）构造出想要的加密乘积 $ab d$ 了。配对的核心性质可以表示成下面的等式： $e (g^{a}, g^{b}) = e (g^{b}, g^{a}) = e (g^{ab}, g^{1}) = e (g^{1}, g^{ab}) = e (g^{1}, g^{a})^{b} = e (g^{1}, g^{1})^{ab} = e (g, g)^{ab}$

Note：配对操作是通过改变椭圆曲线来实现这些性质的，现在我们用的符号 $g^{n}$ 就代表曲线上一个由生成元 $g$ 自相加了 n 次的点，而不是我们前面用到的乘法群生成元。 The survey DBS04 provides a starting point for exploration of the cryptographic pairings.

Technically, 配对的结果是目标集(target set) 的不同 generator $g$ 下原始值(raw value) 的加密产物(encrypted product)，即 $e (g^{a}, g^{b}) = g^{ab}$ 。因此它具有同态加密的性质，例如，我们可以将多个配对的加密乘积加在一起： $e (g^{a}, g^{b}) \cdot e (g^{c}, g^{d}) = g^{ab} \cdot g^{c d} = g^{ab + c d} = e (g, g)^{ab + c d}$

注意：配对操作是通过改变椭圆曲线来实现这些性质的，现在我们用的符号 $g^{n}$ 就代表曲线上一个由 $g$ 自相加了 $n$ 次的点，而不是我们前面用到的乘法群生成元。 DBS04 这个 survey 提供了学习 Pairing 的 starting point

Trusted Party Setup

有了 cryptographic pairings，我们现在就准备去设置安全公开且可复用的参数了。假定一下我们让一个诚实的参与方来生成秘密值 $s$ 和 $α$ . 一旦 $α$ / $s$ 的幂及其对应的 α-shift 被加密，那么原始数据就必须要被删除 ( $i \in {0, 1, \dots, d}$ ) : $g^{α}, g^{s^{i}}, g^{α s^{i}}$

这些参数通常被称为 common reference string (CRS) . CRS 生成后，任何的 $P$ 和 $V$ 都可以使用它来构造 非交互式的 零知识证明协议。CRS 的优化版本将包含目标多项式的加密值 $g^{t (s)}$ (While non-crucial)

把 CRS 分成两组：

proving key (alse called evaluation key) : $(g^{s^{i}}, g^{α s^{i}}), i \in {0, 1, \dots, d}$
verification key : $(g^{t (s)}, g^{α})$

使用 Pairing 就可以将 加密值相乘 (记得第一节说过, 加密值不能直接相乘, 会破坏同态的性质)， $V$ 就可以在协议的最后一步验证多项式了 (有了 verification key ， $V$ 就可以处理从 $P$ 那里得到的加密多项式的值 $g^{p}, g^{h}, g^{p^{'}}$ :

在加密空间中校验 $p (x) = t (x) \cdot h (x)$ ： $e (g^{p}, g^{1}) = ? e (g^{t}, g^{h}) w hi c h i s e q u i v a l e n t t o e (g, g)^{p} = ? e (g, g)^{t \cdot h}$
Chech polynomial Restriction : $e (g^{p}, g^{α}) e (g, g)^{α \cdot p} = ? e (g^{p^{'}}, g) = ? e (g, g)^{p^{'}}$ Recall what is $g^{p^{'}}$ [[#Zero-Knowledge]] :
$g^{p^{'}} = g^{α p (s)} = (g^{α s^{0}})^{c_{0}} \cdot (g^{α s^{1}})^{c_{1}} \cdot \dots \cdot (g^{α s^{d}})^{c_{d}} = g^{c_{0} α s^{0} + c_{1} α s^{1} + \dots + c_{d} α s^{d}} = g^{α \cdot (c_{0} s^{0} + c_{1} s^{1} + \dots + c_{d} s^{d})}$

Trusted MPC

尽管受信任设置很有效率，但众多 CRS 用户也必须要相信生成者确实删除了 α 和 s ，这一点没有办法证明（proof of ignorance 是一个正在积极研究的领域 DK18），所以这种方法依然是无效的。因而很有必要去最小化或者消除这种信任。否则一个不诚实的参与方就可以构造假证明而不被发现。

一种解决办法就是由多个参与方使用前面小节中介绍的数学工具来生成一个组合式CRS，这样这些参与方就都不知道「秘密」了。下面是一个实现方案，我们假设有三个参与者 Alice，Bob 和 Carol ，对应为 A，B 和 C，其中 i 为 1, 2, …, d：

Alice 选择随机数 $s_{A}$ 和 $α_{A}$ ，然后公开她的 CRS：
1. $(g^{s_{A}^{i}} ， g^{α_{A}} ， g^{α_{A} s_{A}^{i}})$
Bob 选择他的随机数 $s_{B}$ 和 $α_{B}$ ，然后通过同态乘法结合 Alice 的 CRS：
1. $((g^{s_{A}^{i}})^{s_{B}^{i}}, (g^{α_{A}})^{α_{B}}, (g^{α_{A} s_{A}^{i}})^{α_{B} s_{B}^{i}}) = (g^{(s_{A} s_{B})^{i}}, g^{α_{A} α_{B}}, g^{α_{A} α_{B} (s_{A} s_{B})^{i}})$
然后公开两方 Alice-Bob 的 CRS 结果：
1. $(g^{s_{A B}^{i}}, g^{α_{A B}}, g^{α_{A B} s_{A B}^{i}})$
Carol 用她的随机数 $s_{C}$ 和 $α_{C}$ 做同样的事：
1. $((g^{s_{A B}^{i}})^{s_{C}^{i}}, (g^{α_{A B}})^{α_{C}}, (g^{α_{A B} s_{A B}^{i}})^{α_{C} s_{C}^{i}}) = (g^{(s_{A} s_{B} s_{C})^{i}}, g^{α_{A} α_{B} α_{C}}, g^{α_{A} α_{B} α_{C} (s_{A} s_{B} s_{C})^{i}})$
然后公开 Alice-Bob-Carol 的 CRS:
1. $(g^{s_{A BC}^{i}}, g^{α_{A BC}}, g^{α_{A BC} s_{A BC}^{i}})$
这个协议最后我们就获得了一个混合的 $s^{i}$ 和 $α$ ：

$s^{i} = s_{A}^{i} s_{B}^{i} s_{C}^{i}, α = α_{A} α_{B} α_{C}$

除非他们串谋，否则参与者们互相之间并不知道其他人的秘密参数。实际上，一个参与者必须要和其它所有的参与者串谋才能得到 s 和 α，这样在所有的参与者中只要有一个是诚实的，就没有办法伪造证明。

注意：这个过程可以被尽可能多的参与者重复完成

有一个问题是如何验证参与者在生成 CRS 时用的随机数值是一致的，因为攻击者可以生成多个不同的随机数 $s_{1}, s_{2}, \dots,$ 和 $α_{1}, α_{2}, \dots,$ ，然后代入这些不同的随机数去执行 s 的不同次幂计算（或提供随机数作为一个 CRS 的扩充），从而使 CRS 无效或者不可用。

庆幸的是，因为我们可以使用配对来乘以加密值，所以我们就可以从第一个参数开始逐一执行一致性校验，并且确保了每个参数都源于前一个。

我们用 s 的 1 次幂作为标准来校验每一个其它次幂的值与之是否保持一致 :

$e (g^{s^{i}}, g) = e (g^{s^{1}}, g^{s^{i - 1}}) ∣_{i \in 2, 3, 4, \dots, d}$
例如 :
- 2 次幂： $e (g^{s^{2}}, g) = e (g^{s^{1}}, g^{s^{1}}) => e (g, g)^{s^{2}} = e (g, g)^{s^{1 + 1}}$
- 3 次幂： $e (g^{s^{3}}, g) = e (g^{s^{1}}, g^{s^{2}}) => e (g, g)^{s^{3}} = e (g, g)^{s^{1 + 2}}$

我们现在再验证一下前面步骤中 α-变换后的值是否正确：

$e (g^{s^{i}}, g^{α}) = e (g^{α s^{i}}, g) ∣_{i \in [d]}$
例如：
- 3 次幂： $e (g^{s^{3}}, g^{α}) = e (g^{α s^{3}, g}) => e (g, g)^{s^{3} \cdot α} = e (g, g)^{α s^{3}}$

$i \in [d]$ 是 $i \in 1, 2, \dots, d$ 范围的缩写形式，在后面会经常看到

当我们在验证每一个参与者秘密参数的一致性时，要注意参与者生成 CRS 的过程并没有强制后一个参与者（就是我们例子中的 Bob 和 Carol）都要使用前面已经公开的 CRS。因而如果一个攻击者是链上的最后一个参与者，他可以像链上的第一个参与者一样忽略前面的 CRS 随便构造一个有效的 CRS，这样他就变成了唯一一个知道秘密 s 和 α 的人。

为了解决这个问题，我们可以额外再要求除了第一个以外的每一个参与者去加密然后公开他的参数。例如，Bob 同样公开了 : $(g^{s_{B}^{i}}, g^{α_{B}}, g^{α_{B} s_{B}^{i}}) ∣_{i \in [d]}$

这就可以去验证 Bob 的 CRS 是乘以了 Alice 的参数后正常获得的， $i \in [d]$ :

$e (g^{s^{i}_{A B}}, g) e (g^{α_{A B}}, g) e (g^{α_{A B} s^{i}_{A B}}, g) = e (g^{s^{i}_{A}}, g^{s^{i}_{B}}) = e (g^{α_{A}}, g^{a_{B}}) = e (g^{α_{A} s^{i}_{A}}, g^{α_{B} s^{i}_{B}})$

同样的，Carol 也必须证明她的 CRS 是乘以了 Alice-Bob 的 CRS 后正常获得的。

这是一个健壮的 CRS 设置模式，它并不完全依赖于单个参与者。事实上，即使其它所有的参与者都串谋了，只要有一个参与者是诚实的，他能够删除并且永远不共享它的秘密参数，这个 CRS 就是有效的。所以在设置 CRS （有时候被称为仪式 Wil16）的时候有越多不相关的参与者参与，伪造证明的可能性就越低。当有相互竞争的参与方参与的时候，就几乎不可能伪造证明了。这种模式能够包容其他一些怀疑这种 setup 可识别性的不受信方因为校验步骤确保了他们不会破坏（这里也包括很弱的 α 和 s 的使用）最终的 CRS。

even@安比实验室: 现在有一些zkSNARK方案支持可升级的 CRS，任何怀疑CRS的参与方都可以对CRS 进行更新。此外还有一些 zkSNARK方案支持 Universal CRS，用不着对每一个电路进行受信任设置，而是只需要全局完成一次即可。除此之外，大量无需 Trusted Setup 的方案正在被充分研究。

Succinct Non-Interactive Argument of Knowledge of Polynomial

We are now ready to consolidate the evolved zk-SNARKOP protocol. (准备整合演进的 zk-SNARKOP 协议) , now ${s^{i}}_{i \in [d]}$ denotes a set ${s^{1}, s^{2}, \dots, s^{d}}$

我们已经明确 target poly $t (x)$ 和 $P$ 的多项式阶数 $d$ :

Setup

挑选随机值 $s, α$
计算加密值 $g^{α}$ , ${g^{s^{i}}}_{i \in [d]}$ , ${g^{α s^{i}}}_{i \in {0, \dots, d}}$
生成 proving key： $(g^{s^{i}}, g^{α s^{i}}), i \in {0, 1, \dots, d}$ (和上面相同)
生成 verification key： $(g^{α}, g^{t (s)})$ (和上面相同)

Proving

分配多项式系数 ${c_{i}}_{i \in {0, \dots, d}}$ (即知识), $p (x) = c_{d} x^{d} + \dots + c_{1} x^{1} + c_{0} x^{0}$
自己求多项式 $h (x) = p (x) / t (x)$ (一般用 FFT 完成 ?)
代入 ${g^{s^{i}}}_{i \in [d]}$ 计算多项式 $g^{p (s)}$ 和 $g^{h (s)}$ 的值
代入 ${g^{α s^{i}}}_{i \in [d]}$ 计算变换多项式 $g^{α p (s)}$ 的值
选择随机数 $δ$ (“零成本“的 zero-knowledge)
构造随机化的证明(randomized proof) : $π = (g^{δ p (s)}, g^{δ h (s)}, g^{δ α p (s)})$

verification :

Parse proof(解析证明) $π$ as $(g^{p}, g^{h}, g^{p^{'}})$
- 我觉得这里的表述有问题, 因为 $V$ 是不知道 $δ$ 的(也不需要知道) , $δ$ 是 $P$ 用零知识武装自己的关键工具, $V$ 不需要解包或还原 $δ$ ， $V$ 只需用 Pairing 验证证明的一致性 :
验证多项式约束： $e (g^{p^{'}}, g) = e (g^{p}, g^{α})$
- $e (g^{α}, g^{δ p (s)}) = e (g^{δ α p (s)}, g)$
- —————— $α$ 保证 $P$ 确实用了 $S e t u p$ 提供的 $g^{s^{i}}$
验证多项式系数： $e (g^{p}, g) = e (g^{t (s)}, g^{h})$
- $e (g^{δ p (s)}, g) = e (g^{t (s)}, g^{δ h (s)})$
- —————— $δ$ 保护了 $P$ , 实现了零成本 Zero-knowledge

Remark 3.3 如果 pairing 的结果有可能在其它类似的乘法协议中被复用，那么这里就完全没有安全性可言了，因为这样的话 $P$ 可以自己构造 $g^{p^{'}} = e (g^{p}, g^{α})$ ,

这里我理解就是 $e (g^{p}, g^{α})$ 被 $P$ 拿到了并复用了, 然后他可以发送 $e (g^{p}, g^{α})$ 作为 $g^{p^{'}}$ 的值来 cheat $V$

这样也可以通过“多项式约束”的检查： $e (e (g^{p}, g^{α}) ， g) = e (g^{p}, g^{α})$ —— 因为这是个恒等式, $V$ 去验证一个 “恒等式” 没有任何意义 —— 结果永远是 Accept .

Conclusion

我们用 zk-SNARK 协议来解决多项式问题的知识，不过这是一个有局限的例子。因为大家可以说 $P$ 只要用另外一个有界的多项式去乘以 $t (x)$ 就可以很容易得构造出一个能够通过测试的多项式 $p (x)$ ，并且这种结构也是有效的。

$V$ 知道 $P$ 有一个有效的多项式，但是并不知道是哪一个。我们可以利用多项式的其他性质添加额外的证明，如: 被多个多项式整除，是某个多项式的平方。虽然可能会有一个服务能够接受，存储和奖励所有经过证明的多项式，或者有一个需求，加密计算某种形式的未知多项式。然而若有通用方案就可以支撑无数的应用。

even@安比实验室:总结一下这篇文章中一步一步解决了下面的几个问题：

保证 prover 的证明是按照规则正确构造的 ——> KEA ( $a^{'} = a^{α} (mod n))$ )

保证知识的零知性 ——> “无成本的” $δ$ 变换

可复用证明 ——> 非交互式

非交互中如何设置安全公开且可复用的参数 ——> 参数加密，verifier 借助 airing 进行验证

保证参数的生成者不泄密 ——> MPC’s Setup

至此，一个用来证明多项式知识的完整的 zk-SNARK 协议就构造出来了，不过现在的协议在通用性上依然还有很多限制，后面的文章将继续介绍如何构造通用的 zk-SNARK。

Ref :

https://secbit.io/blog/2020/01/01/learn-zk-snark-from-zero-part-two/
https://medium.com/@imolfar/why-and-how-zk-snark-works-2-proving-knowledge-of-a-polynomial-f817760e2805
https://medium.com/@imolfar/why-and-how-zk-snark-works-3-non-interactivity-distributed-setup-c0310c0e5d1c

作者：Maksym Petkus

翻译 & 注解：even@安比实验室（even@secbit.io）

校对：valuka@安比实验室

本系列文章已获作者中文翻译授权

翻译原链接

Computation

Let us consider a simple program in pseudocode:

Algorithm 1: Operation depends on an input 
—————————————————————————————————————————————————————————
function calc(w, a, b)         
    if w then         
        return a × b         
    else         
        return a + b         
    end if         
end function

Therefore we need to find a way to convert a program into the polynomial form , like this $f (w, a, b) = w (a \cdot b) + (1 - w) (a + b)$

Executing $c a l c (1, 4, 2)$ and evaluating $f (1, 4, 2)$ will yield the same result: 8. $c a l c (0, 4, 2)$ and $f (0, 4, 2)$ would both be resolved to 6. We can express any kind of finite program in such a way.

猜想一下，是否只要是能够用多项式表示的程序都可以做证明？

Single Operation

Any computation at it is core consists of elemental operations of the form:

$左操作数运算操作符右操作数 = 输出$

If we can represent operand values as polynomials (and we indeed can as outlined) then through the arithmetic properties, we will be able to get the result of an operation imposed by an operand. (如果我们可以将操作数的值表示为多项式(我们也确实可以这么做)，那么利用算术属性，我们就能够得到操作数的计算结果了。)

@Even : 回忆一下，在本系列的第一篇——多项式的性质与证明中，我们曾经说过“任何多项式在任意点的计算结果都可以看做是其唯一身份的表示。”

反过来当我们知道某个多项式的时候，是不是也就意味着我们知道多项式上某个点的取值。这就是借助多项式来完成证明的依据。

Enforcing Operation

如果一个 prover 声称有某 2 个数字的乘积，verifier 要怎样去验证呢？

Recap computation form, 我们也可以将其表示为一个运算多项式 :

$左操作数 l (x) 运算符 operator 右操作数 r (x) = = 输出 o (x)$

在计算过程中, 如果操作数(operands) 和 结果(output) 都能用多项式的形式正确地表示出来，那么 $l (a) operator r (a) = o (a)$ 就应该成立

也就表明, 当取值为 $a$ 时, 多项式 $l (a) operator r (a) - o (a) = 0$ 成立,

即该多项式一定有一个根 $a$ , 因此，这个多项式里面一定包含因式(cofactor) $(x - a)$ , 这就是我们要证明的目标多项式(target polynomial) ，即 $t (x) = (x - a)$

For example, let us consider operation: $3 \times 2 = 6$

可以用一个简单的多项式表示它： $l (x) = 3 x, r (x) = 2 x, o (x) = 6 x$ 取 $a = 1$ ，即 $l (1) = 3; r (1) = 2; o (1) = 6$

运算多项式就变成了 :

$l (a) \times r (a) = o (a) 3 x \times 2 x = 6 x 6 x^{2} - 6 x = 0$

因而如果 $P$ 用多项式 $l (x), r (x), o (x)$ 来代替 $p (x)$ ，因其依然可被 $t (x)$ 整除，所以 $V$ 就认可其是有效的

相反，如果 prover 尝试用 $4$ , 即 $o (1) = 4$ 来代替输出值去欺骗 verifier ，即 $o (x) = 4 x$ ，那么运算多项式就变成了 $6 x^{2} - 4 x = 0$ , 这个多项式并没有 $x = 1$ 的解，因而 $l (x) \times r (x) - o (x)$ 不能被 $t (x)$ 整除：

因而

V

不会接受这个计算结果（就像**因式分解**这一章描述的那样）

在前面的协议中，我们要证明的多项式是 $p (x) = t (x) h (x)$ ，这里我们把 $p (x)$ 替换成 $p (x) = l (x) r (x) - o (x)$ , 这仍然是被 $V$ 承认有效的。这里目标多项式 $t (x)$ 的根就是对应能够计算出数学表达式的值的 $x$

上面例子里面取 $x = 1$ 作为运算编码的位置, 1 可以换成任何别的值，比如说 $x = 2 ， 3 ，或 101$ .. 在 [GGPR] 与 [PHGR] 论文中，这个取值是一个随机值，被称为 “root”

Proof of Operation

前面多项式的 SNARK一章，我们已经能够证明多项式 $p (x)$ 的知识了，只不过现在要计算的是三个多项式 $l (x), r (x), o (x)$ 的知识。我们可以定义 $p (x) = l (x) \times r (x) - o (x)$ ，但这里存在两个争议点。

① 在我们的协议中, 证明阶段是不能做加密值乘法计算的 (即 $l (s) \times r (s)$ )，因为 Pairing 只能用一次(不能复用, 会有安全风险?) —— Pairing 要用在校验多项式的约束上
② 这里给证明者留下了一个可以修改多项式结构(修改知识) 但依然保留有效因式 $t (x)$ 的机会，for example $p (x) = l (x)$ or $p (x) = l (x) - r (x)$ or even $p (x) = l (x) \times r (x) + o (x)$ —— 只需要 $p (x)$ 有一个根 $(x = a)$ 就可以骗过 $V$ , 这样是不行的 !

所以 $P$ 必须要 分别提供 多项式 $l (s), r (s), o (s)$ 值的证明，即协议必须修改要证明的多项式的知识( knowledge of polynomial must be adjusted.)

In essence(本质上), $V$ 在加密空间中要验证的是 $l (s) \times r (s) - o (s) = t (s) h (s)$ .

即使 $V$ 可以用 Pairing 来执行乘法(multiplication)，但在 Pairing 中做减法 ( $- o (x)$ ) 是非常昂贵的计算（would require to find inverse of $g^{o (s)}$ ），所以咱们把 $o (x)$ 移到右边：
$l (x) r (x) = t (x) h (x) + o (x)$

在加密空间中， $V$ 的验证就可以转换成： $e (g^{l (s)}, g^{r (s)}) e (g, g)^{l (s) r (s)} e (g, g)^{l (s) r (s)} = e (g^{t (s)}, g^{h (s)}) \cdot e (g^{o (s)}, g) = e (g, g)^{t (s) h (s)} \cdot e (g, g)^{o (s)} = e (g, g)^{t (s) h (s) + o (s)}$

Red Part: recall that the result of cryptographic pairings supports encrypted addition through multiplication, see section on pairings.

$R ec a ll : e (g^{a}, g^{b}) \cdot e (g^{c}, g^{d}) = g^{ab} \cdot g^{c d} = g^{ab + c d} = e (g, g)^{ab + c d}$

保持 setup 阶段不变，协议更新为：

这个协议就能够证明两个值相乘的计算结果是正确的了。

你可能注意到了在这个新的协议中我们放弃了 $δ$ - 零知识 部分。这么做是为了简化协议, 后面的章节我们会再变回零知识 ~

even@安比实验室：上面例子里面取 $x = 1$ 这个特殊值作为运算编码的位置。当然这里的 1 可以换成任何别的值，比如说换成 $x = 2, 3, 或 101$ 等等。在[GGPR] 与 [PHGR] 论文中，这个取值是一个随机值，被称为 “root”

名词定义

operand : 符号左边叫 left operand , right operand

是具体的操作数, 比如 $a \times b$ 里的 a & b ; $2 \times 3$ 里的 2 & 3

oprand polynomials : l(x) and r(x).

left operand polynomial (green) 几个约束等式的操作数左边竖列, 构成的 poly 叫 left operand polynomial
right operand polynomial (blue) ….

output polynomials : 等式右边的所有 Output 操作数竖列构成的 poly 叫 output polynomials

Multiple Operations

We can prove a single operation, but how do we scale(拓展) to prove $m u lt i pl e o p er a t i o n s$ (which is our ultimate goal)? Let us try to add just one another operation. Consider the need to compute the product: $a \times b \times c \times d$ :

来看一个有三个乘法运算的例子 2 × 1 × 3 × 2，它按照下面的步骤执行：

$2 \times 1 = 2 2 \times 3 = 6 6 \times 2 = 12$

我们要把它们表示为多项式，对于 $x \in {1, 2, 3}$ ， $l (x)$ 相应的要 $= 2 ， 2 和 6$ 。即通过点 $(1, 2), (2, 2), (3, 6)$ ，同样的: $r (x) \in (1, 1), (2, 3), (3, 2)$ ， $o (x) \in (1, 2), (2, 6), (3, 12)$

we use Polynomial Interpolation to represent these.

Interpolation Result :

$l (x) = 2 x 2 - 6 x + 6; r (x) = \frac{- 3 x ^{2} + 13 x - 8}{2}; o (x) = x^{2} + x$

Multi-Operation Polynomials

Now we have operand polynomials $l (x), .., o (x)$ , let us see step-by-step how the correctness of each operation is verified.

Recall that a verifier is looking for equality $p (x) = l (x) \times r (x) - o (x) = t (x) h (x)$ .

本例中，计算是在点 $x \in {1, 2, 3}$ 处被表示出来的，所以 target poly $t (x)$ 在这些点处必须 evaluation 为 $0$ ，换句话说， $t (x)$ 的根 root 必须是 1，2 和 3，它的基本形式就是：

在实际过程中, $x$ 一般是放到单位根 root of unity —— $ω$ 里的 $t (x) = (x - 1) (x - 2) (x - 3)$

Firstly, $l (x) \times r (x)$ are multiplied which results in:

Secondly, the $o (x)$ is subtracted from the result of $l (x) \times r (x)$ which is $l (x) \times r (x) - o (x)$ :

已经可以看出每一个 operands multiplication 都对应了正确的结果。最后一步 $P$ 要算出一个有效因式：

$h (x) = \frac{l ( x ) \times r ( x ) - o ( x )}{t ( x )} = \frac{- 3 x ^{4} + 22 x ^{3} - 57 x ^{2} + 63 x - 24}{( x - 1 ) ( x - 2 ) ( x - 3 )}$

通过长除法(long division) 可以算出： $h (x) = - 3 x + 4$ :

V

自己代入

h (x) = - 3 x + 4

，

V

可以自己计算

t (x) h (x)

h (x) = - 3 x + 4; t (x) = (x - 1) (x - 2) (x - 3) t (x) h (x) = - 3 x^{4} + 22 x^{3} - 57 x^{2} + 62 x - 24

> PS: 这里为了简化过程, 省略了完整协议中的 `δ-zero-knowledge` 和 `α-shift`

现在显然 $p (x) = l (x) \times r (x) - o (x) = t (x) h (x)$ ，这就是我们要证明的内容。

这里只用了一组多项式 $l (x), r (x), o (x)$ 就将所有计算的约束关系表示出来了，有几步计算, 也就对应着目标多项式 $t (x)$ 要有几个根 (这里我这么理解: 计算的步数多了, 那么 $t (x)$ 的根也就多了, 比如可能是 $(x - ω^{0}) \cdot (x - ω^{1}) \cdot \dots \cdot (x - ω^{9})$ , 因为约束等式的行数多了, 也就需要同步约束这些等式符合所有的计算完整性验证 )

当前的协议似乎存在一些缺陷，多项式只能证明 $P$ 拥有一组多项式 $l (x), r (x), o (x)$ ，在 $t (x)$ 的几个根的取值处 $l (x) \cdot r (x) - o (x) = 0$ ，但无法证明这组多项式符合我们要证明的数学表达式： 1）多个计算关系之间也是分开表示的，这些算式之间的关系也同样无法进行约束 2）由于 $P$ 生成的证明中只有计算结果，左操作数，右操作数，输出在计算中混用也不会被发现 3）由于左操作数，右操作数，输出是分开表示的，他们互相之间的关系无法进行约束

Variable Polynomials

现在我们可以一次证明多个运算（如上百万个甚至更多）了，但是前文结尾提到了几个关键缺点(critical downside)

如果证明中执行的“程序“在不同运算中使用了相同的变量作为操作数或输出，例如：

$a \times b = r_{1} a \times c = r_{2}$

然而，因为我们的协议中是允许 $P$ 为多项式设置任何系数的，所以他可以不受限制得为不同计算中的 $a$ 设置不同的值，如：

This freedom breaks **consistency** and allows

P

to prove the execution of some other program which is not what verifier is interested in. (**这种自由打破了一致性**, 允许

P

去证明一些无关的程序执行)

Therefore we must ensure that any variable can only have a single value across every operation it is used in. (因而我们必须要确保每一个变量在所有运算中出现的地方都只有一个取值。)

注意：文中的 variable 与常规的计算机科学中 variable 的定义不同，这里的变量是不可改变的(immutable), 而且每次执行都只赋值一次(only assigned once per execution) (即示例伪代码中的那些不会被修改的变量)

zkSNARK 论文中，这个「变量」其实有一个对应的名词叫做 assignment，是算术电路的「赋值」，对应的是问题结构或者说算术电路的结构。而所有的 assignments 是一个算术电路可满足性问题的解，包含了算术电路的输入值以及电路运算过程中输出的中间结果值 (没看懂这里)

Single-Variable Operand Polynomial

那么, How to ensure 每一个变量在所有运算中出现的地方都只有一个取值? 究其原因, $P$ 可以设置不同值是因为他可以任意控制 $x$ 的系数 $a \times b = r_{1} a \times c = r_{2} (①) (②)$ a malicious $P$ 可以分别为第一第二行的 $a$ 分配不同的值, 比如分别分配 $2$ 和 $5$ :

assign $2$ for $a$ in raw ① , 那么此处 $l (x)$ 的系数为 $2$ , 即函数通过点 $(1, 2)$
assign $5$ for $a$ in raw ②, 那么此处 $l (x)$ 的系数为 $5$ , 即函数通过点 $(2, 5)$

此时就出现了不一致问题 —— 那么如果对于同一个变量 $a$ , 这些系数是固定的，就可以解决问题了

如下是 2 个包含相等值的多项式 : 它们分别都表示了有两个相等值对应的运算（即在 $x = 1$ 和 $x = 2$ 处），第一个多项式的取值为 1，第二个多项式的取值为 2：

注意: 这 2 个多项式的相应的系数是成比例的 —— 第 2 个多项式的系数是第 1 个的 2 倍

那么由于多项式的算术性质，如果我们想要同时地改变多项式中所有的值 , 我们就需要改变它的比例，如果我们用一个数字 $n$ 乘以多项式，那么多项式值就会等比例变换为 $n$ 倍

Consequently, if a verifier needs to enforce the prover to set the same value in all operations, then it should only be possible to modify the proportion and not the individual coefficients.
(因此，如果 $V$ 需要在所有计算中强制 $P$ 设置相同的值，他就要限制 $P$ 只能改动多项式的比例, 而不是恣意篡改某处操作的单个系数)

怎么保持系数比例不变呢？对于这个问题我们可以先思考一下在左运算多项式 (left operand polynomial) 中我们提供的 Proof 是什么 —— 是 $l (x)$ 在一些秘密值 $s$ 处的加密值： $g^{l (s)}$

上文中, 我们已经知道怎样通过 α-shift 去限制 $P$ 只能使用 $V$ (或 $S e t u p$ ) 提供的 $s$ 的幂做计算，来使得单个运算能够满足同态乘法 (such that homomorphic multiplication is the single operation available.)

和限制单个求幂值相似， $V$ 可以一次限制完整的多项式 。而不只是提供单独的加密及其 α-shift :

$g^{s}^{1}, g^{s}^{2}, g^{s}^{3}, \dots, g^{s}^{d}, g^{α s}^{1}, g^{α s}^{2}, \dots, g^{α s}^{d}$

协议的过程是：

Setup :

使用多项式对应的系数构造相应的 operand polynomial $l (x)$
创造随机 secret $α, s$
使用加密的 $l (s)$ 和它的 ”α-shifted“ : $(g^{l (s)}, g^{α l (s)})$ 来设置 proving key
设置 verification key： $(g^{α})$

Proving :

注意这个语境下, $l (x)$ 对应的操作数只有 $a$ 一个 (Recall ① ② 两个等式) , 所以若 $a$ 赋值为 $v$ , 则第① 第② 个等式里, 都要保持 $a$ 的赋值为 $v$
$P$ 对 $l (x)$ 的操作数 $a$ 的赋值为 $v$
- 将其乘以操作数多项式: $(g^{l (s)})^{v}$
- 乘以 α-shifted 后的 operand polynomial : $(g^{α l (s)})^{v}$
提供 operand polynomial multiplication Proof : $(g^{v l (s)}, g^{v α l (s)})$

这里的 multiplication 就是指通过 $v$ 来限制 $P$ 对 operand polynomial 只能提供相同的 assignment

Verification

Parse the Proof as $(g^{l}, g^{v})$
Pairing 验证比例 $e (g^{l^{'}}, g) = e (g^{l}, g^{α})$

前面反复提到, $P$ needs to respond with the same α-shift , and because he cannot recover α from the proving key , the only way to maintain the shift is to multiply both encryptions by the same value : $g^{l (s)} an d g^{α l (s)}$

同样的道理, 用这种方法可以限制 $P$ 让其无法修改 $l (x)$ 的单个系数 (modify individual coefficients of $l (x)$ ) , 如果多项式为 $l (x) = a x^{2} + b x + c$ ， $P$ 只可以用一个值 $v$ 去 multiply 整个多项式一次：

$v \cdot (a x 2 + b x + c) = v \cdot a x 2 + v \cdot b x + v \cdot c$ Multiplication by another polynomial is not available since pairings, and α-shifts of individual exponents of s are not provided. Prover cannot add or subtract either since:

$g^{α (l (x) + a^{'} x^{2} + c^{'})} \neq = g^{α l (x)} \cdot g^{a^{'} x^{2}} \cdot g^{c^{'}}$

This requires the knowledge of unencrypted $α$ , 这里也同样需要未加密的 $α$ 的知识(才能运算)

详细解释一下上式 :

考虑 $l (x) = a x^{2} + b x + c$ ，如果 $P$ 能够任意修改多项式的系数，他可能会想要构造一个新的多项式 $l^{'} (x) = a x^{2} + a^{'} x^{2} + b x + c^{'}$ 来欺骗 $V$
但是， $P$ 无法实现这样的操作，因为他不知道确切的 $α$ 的值 , 最后的等式是为了展示这一限制：
- 左侧： $P$ 需要满足 α-shift, 通过这种方式修改 $l (x)$ 的各个系数
- 右侧： $S e t u p$ 提供了 $(g^{l (s)}, g^{α l (s)})$ , 但没有提供 $(g^{α a^{'} x^{2}}, g^{α c^{'}})$ , 所以 $P$ 无从得知 $(g^{α a^{'} x^{2}}, g^{α c^{'}})$ , 所以 $P$ 只能提供可怜的 $g^{a^{'} x^{2}} \cdot g^{c^{'}}$ , 而这是无法通过 Pairing 验证的 $g^{α (l (x) + a^{'} x^{2} + c^{'})} \neq = g^{α l (x)} \cdot g^{a^{'} x^{2}} \cdot g^{c^{'}}$

现在有了这个协议，不过怎么去构造 operand polynomial $l (x)$ 呢？由于任何整数都可以通过乘以 1 得到它本身，所以多项式中对应的每个计算结果都应该为 1 ，即：

> (这里的表述不清晰, 很多人没看懂, 我个人觉得类似拉格朗日基, 后面多变量会讲到: 用到了就设置为 1, 用不到就设为 0)

然后再让 prover 在其上”分配“一个值 a ：

Remark 4.1 : $P$ 可以在操作数多项式上分配一个 $v^{'}$ ，而 $V$ 不能检测到 , 下面具体描述了 $P$ 对多项式进行特定加（或减）操作的能力，而这种操作不会影响 $V$ 配对验证 , 因而可以修改多项式使其超出 $V$ 的预期或 prove a different statement，后面的章节我们将会解决掉这个问题 :

$P : g^{v l (s)} \cdot g^{v^{'}} = g^{v l (s) + v^{'}} V : g^{αv l (s)} \cdot (g^{α})^{v^{'}} = g^{α (v l (s) + v^{'})} V : e (g^{α (v l (s) + v^{'})}, g) = e (g^{v l (s) + v^{'}}, g^{α}) \leftarrow 2 a re i d e n t i c a ll y e q u a l$

identically equal: 恒等

由于 verification key 中包含了加密了的 $α$ : $g^{α}$ ，所以 $P$ 可以用多项式加（或者减）任意一个值 $v^{'}$ 而不会破坏 Pairing 的成立. 后面我们会解决掉这个 bug

Summary/Recap

这一小节是解决这样一个问题，算术电路中一个 input wire 或者 output wire可能同时会作为多个门的输入 wire，如何确保约束这些公用 wire 的问题。

由于要证明的数学表达式是公开的，那么各个算式之间的约束关系也就是公开的，那么我们就可以把构造多项式的工作交给 $se t u p$ 环节，这样 $P$ 只要填上对应的数值就可以了。

上文这个方法就限制了在同一个操作数多项式上，不同的计算式中使用的同一个值的约束关系；同样若一个操作数多项式中用到了多个值，也可以将这些值全都加起来，如下文所述。

Multi-Variable Operand Polynomial

如上文, 因为只有当所有的左操作数使用同一个变量 $a$ 的时候我们才可以设置一个值。但是如果左操作数中再多一个值 $d$ 要怎么做呢 ?

$a \times b = r_{1} a \times c = r_{2} d \times c = r_{3}$

Therefore we can separate the operand polynomial $l (x)$ into 2 operand variable polynomials : $l_{a} (x) an d l_{d} (x)$

变量 $a$ 和 $d$ 可以被分别 赋值 & 约束，然后加在一起 , 来表示所有的左操作数变量。

如果 多变量多项式 在一个对应运算中被用做操作数，那么这一项就置为 1，否则就置为 0 , 0 跟任何值相乘结果都是零，当把他们相加在一起的时候也就可以忽略掉这一项 (类似 Lagrange Basis 的作用) 在我们的例子中, 这些变量多项式必须满足以下计算：

$l_{a} (1) = 1, l_{a} (2) = 1, l_{a} (3) = 0 l_{d} (1) = 0, l_{d} (2) = 0, l_{d} (3) = 1$

于是我们就可以将每个变量分开 assigned value ，然后把他们加在一起来计算出操作数多项式，例如当 $a = 3$ 和 $d = 2$ 时 , 得到 $3 \cdot l_{a} (x) + 2 \cdot l_{d} (x)$ ：

上图中的 $3_{a}$ 代表: 用 3 实例化的变量 $a$ ( variable $a$ instantiated with value 3 )

从现在起 , 我们用大写的 $L (x)$ 来表示这个复杂的操作符多项式，即

$L (x) = a l_{a} (x) + d l_{d} (x)$

$L (s)$ 仅当每一个 operand variable polynomial 是由 $V$ 约束的 (restricted by the $V$ )，结果才有效

以 left operand 部分而言, 协议部分更改为：

Setup:

构造 $l_{a} (x), l_{b} (x)$ - 使得它能够在对应的 "operation x" 处为 1，其他地方为 0
选择随机数 $s, α$
计算并加密 未赋值的变量多项式 (unassigned variable poly)： $(g^{l_{a} (s)}, g^{l_{d} (s)})$
计算 shifts of these polys : $g^{α l_{a} (s)}, g^{α l_{a} (s)}$
set proving key : $(g^{l_{a} (s)}, g^{l_{d} (s)}, g^{α l_{a} (s)}, g^{α l_{d} (s)})$
set verification key： $(g^{α})$

Proving :

assign values $a, d$ to the variable polys : {\left(g^{l_a(s)}\right)}^\textcolor{green}{a}, \ \ {\left(g^{l_d(s)}\right)}^\textcolor{green}{d}
assign same values to the α-shifted poly : $(g^{α l_{a} (s)})^{a}, (g^{α l_{d} (s)})^{d}$
add all assigned variable polys to form a operand poly : $g^{L (s)} = g^{a l_{a} (s)} \cdot g^{d l_{d} (s)} = g^{a l_{a} (s) + d l_{d} (s)}$
add shifted assigned variable polys to form a shifted operand poly : $g^{α L (s)} = g^{a α l_{a} (s)} \cdot g^{d α l_{d} (s)} = g^{α (a l_{a} (s) + d l_{d} (s))}$
Proving proof of valid assignment of left operand : $(g^{L (s)}, g^{α L (s)})$

Verification :

Parse Proof $(g^{L (s)}, g^{α L (s)})$ i.e. $(g^{L}, g^{L^{'}})$
验证提供的多项式是否是最初提供的多个 未赋值的变量多项式 (unassigned variable poly) 的和： $e (g^{L^{'}}, g) α a l_{a} (s) + α d l_{d} (s) = e (g^{L}, g^{α}) w hi c h c h ec k s t ha t : = α \times (a l_{a} (s) + d l_{d} (s))$

Note: $L (s)$ and $αL (s)$ represent all variable polynomials at once and since $α$ is used only in evaluation of variable polynomials, the prover has no option but to use provided evaluations and assign same coefficients to original and shifted variable polynomials. ( 注意：这里用 $L (s)$ 和 $αL (s)$ 同时代表了所有的变量多项式, 并且由于 $α$ 只用在计算变量多项式中，所以 $P$ 没有别的选择只能在 $S e t u p$ 提供的原始加密值和变换后的加密值上赋予相同的系数做计算 )

As a consequence(因此) the prover :

is not able to modify provided variable polynomials by changing their coefficients, except “assigning” values (除了“分配”值外，不能再修改它们的系数进而来修改 变量多项式 ), because prover is presented only with encrypted evaluations of these polynomials, and because necessary encrypted powers of s are unavailable separately with their α-shifts (因为 Prover 仅提供这些多项式的加密评估，也因为 s 必要次幂的加密值不能与它们的 α 变换值一起使用 )
is not able to add another polynomial to the provided ones because the α-ratio will be broken (不能通过另一个多项式相加去提供一个结果因为这样 α-比例关系将会被破坏掉)
is not able to modify operand polynomials through multiplication by some other polynomial $u (x)$ , which could disproportionately modify the values because encrypted multiplication is not possible in pre-pairings space (不能通过与其他的一些多项式 $u (x)$ 相乘来修改操作数多项式，这样可能会使得修改后的值不成比例因为在预配对空间中无法进行加密乘法)

尽管 prover 被限制了多项式的使用，他还有拥有一些可允许范围内的自由度：

当 prover 决定不加入一些变量多项式 $l_{i} (x)$ 来构造操作符多项式 $L (x)$ 时依然是可以接受的，因为这和为它分配值为 0 是一样的：

$g^{a l_{a} (x)} = g^{a l_{a} (x) + 0 \cdot l_{b} (x)}$

如果 $P$ 添加同一个 变量多项式 很多次也是可以接受的 , 因为这和一次分配多个值的和是一样的：

$g^{a l_{a} (x)} \cdot g^{a l_{a} (x)} \cdot g^{a l_{a} (x)} = g^{3 a l_{a} (x)}$

Summary/Recap

总结一下本文证明协议的大致思路为：

将要证明的程序转换为数学语言表达的形式（即加减乘除的计算）
用多项式在某处的取值来进行计算以此表示数学计算，进而进行证明
用多项式在多处的取值来进行计算表示多个数学运算，进而加以证明
对证明的“程序”在不同计算中使用的相同的变量进行约束

当前的协议约束只解决了部分问题，还有诸多可以改进的地方，在下一节我们将对这些改进项展开讨论并给证明协议进行优化。

Reference :

https://secbit.io/blog/2020/01/08/learn-zk-snark-from-zero-part-three/
https://medium.com/@imolfar/why-and-how-zk-snark-works-4-general-purpose-computation-dcdc8081ee42
https://medium.com/@imolfar/why-and-how-zk-snark-works-5-variable-polynomials-3b4e06859e30

作者：Maksym Petkus

翻译 & 注解：even@安比实验室（even@secbit.io）

校对：valuka@安比实验室

本系列文章已获作者中文翻译授权

翻译原链接

Construction Properties

Constant Coefficients 常量系数

在上文的构造中，我们通过对 未赋值的变量多项式 (unassigned variable polynomials) 的计算得到 0 或者 1 ，以此表示在运算中是否要用到这个变量。自然地想，我们也可以使用其它系数值，包括负数值，因为我们可以插值计算出经过任何必要的点（前提是没有两个计算使用了同一个 $x$ ）的多项式。如下是这种运算的一些例子： $2 a \times 1 b = 3 r_{1} - 3 a \times 1 b = - 2 r_{2}$

现在我们的程序就可以使用常量系数了，例如：

Algorithm 2: Constant coefficients
————————————————————————————————————————————————————————————

function calc(w, a, b)
    if w then
        return 3a × b
    else 
        return 5a × 2b
    end if
end function

在 $S e t u p$ 阶段这些系数类似于 0 或者 1 将被“硬编码”进去，之后就不能再修改了。现在我们将运算形式修改为： $C_{a} \cdot a \times C_{b} \cdot b = C_{r} \cdot r$

或者用更正式的参数 $V_{n} \in {v_{1}, v_{2}, v_{3}, \dots v_{n}}$ 表示：
$C_{l} \cdot v_{l} \times C_{r} \cdot v_{r} = C_{o} \cdot v_{o}$

$l ， r ， o$ 表示变量在运算中的位置 (左/右/输出)

Addition for Free (0 成本做加法)

看一下这个新结构，很显然在多项式的表示中，每一个不同 $x$ 所要代表的操作数都是所有 操作数变量多项式(sum of all operand variable polynomials ) 的总和，其中只有一个被用到的变量是非零值而其它都为 0，下图就很好得表达了这个意思：

我们可以利用这一个结构，加任何数量必要的 _变量_ 到每一个运算的操作符/输出中。例如在第一个运算中，我们可以首先做加法 _a+c_，然后就只需要用别的操作数与之相乘了，即

(a + c) \times b = r

，可以表示为下图：

因而也可以将这些变量中任意个，对它们先乘以任意的系数 , 再一并加入到一起作为单个操作数中，以此来根据相应程序的需要构造一个操作数值。这个特性实际上就允许将运算结构改为：

$(c_{1, a} \cdot a + c_{1, b} \cdot b + \dots) \times (c_{r, a} \cdot a + c_{r, b} \cdot b + \dots) = (c_{o, a} \cdot a + c_{o, b} \cdot b + \dots)$ 或者更正式一些用变量 $v_{i} \in {v_{1}, v_{2}, \dots, v_{n}}$ 和操作数变量系数

$c_{l, i} \in {c_{l, 1}, c_{l, 2}, \dots, c_{l, n}}, c_{r, i} \in {c_{r, 1}, c_{r, 2}, \dots, c_{r, n}}, c_{o, i} \in {c_{o, 1}, c_{o, 2}, \dots, c_{o, n}},$ 这个结构就是： $i = 1 \sum n c_{l, i} \cdot v_{i} \times i = 1 \sum n c_{r, i} \cdot v_{i} = i = 1 \sum n c_{o, i} \cdot v_{i}$

_注意：每一个运算的操作数都有自己的一组系数 $c$ 这里乘法运算是关键，而加法运算都可以被合并到一个更大的乘法运算里面。

Addition, Subtraction and Division

到目前为止，我们一直专注于乘法操作。但是为了能够执行通用计算，真实环境下的程序也需要加法，加法和除法。

加法前面我们确定: 可以在单个操作数的内容中将变量加起来，然后和另一个操作数相乘 —— 即 $(3 a + b) \times d = r$ ，但是如果我们只是想做加法，没有乘法，例如一个程序中需要做 $(a + b)$ 的计算，我们可以按照下面的方式来表示： $(a + b) \times 1 = r$

为什么强行 × 1 呢?
因为我们的结构中对于每一个操作数, 我们既需要常量系数也需要变量 $(c \cdot v)$
1 这个值可以表示为 $c_{1} \cdot v_{1}$ ，其中 $c_{1} = 1$ 可以被“硬编码”到对应的多项式中， $v_{1}$ 是一个变量可以给它分配任何值，那么我们就必须通过一些约束来限制 $v_{1}$ 的值，这个在后面的章节中将会讲到

减法减法与加法几乎一致，唯一的不同就是负系数， $a - b$ 也就是： $(a + - 1 \cdot b) \times 1 = r$ 除法如果我们检查除法运算 $\frac{f a c t or}{d i v i sor} = res u lt$ 可以看到除法的结果是就是我们要得到一个结果值使其乘以 divisor 能够得到 factor 。所以我们也可以用乘法来表示出同一个意思：divisor × result = factor . 这样就是说如果我们想要去证明除法运算 $a / b = r$ ，我们就可以把它表示为： $b \times r = a$

运算的结构也称为 “约束” ，因为多项式结构代表的运算，并非是为了计算出结果，而是在 prover已经知晓的变量赋值的情况下，检验这个运算的过程是否正确。换句话说，即约束 prover 必须提供一致的值，无论这些值是什么。

所有的算术计算（加减乘除）都已经有了，于是运算结构不再需要修改。

even@安比实验室: 约束和运算有一定的关联性。算术电路的目的是为了实现「计算的验证」，而非「计算的过程」。

上一篇文章中，我们提出了一种方法：把构造多项式的工作交给 $S e t u p$ 环节， $P$ 只要填上对应的数值就可以了。这个方法不仅解决了同一个操作数运算符中不一致的问题，同时还带来了额外的便利：

1）允许执行计算的表达式中包含静态系数。 2）虽然 $l (x) \cdot r (x) = o (x)$ 的关系中只有乘法，但利用这个方法也可以轻松的执行加法操作，继而也就解决了减法和除法的问题

Example Computation

看不太懂上面说啥, 直接看例子吧 !!

有了一组通用的运算结构，我们就可以将我们原始的程序转换成一组运算，然后再转换成多项式的形式。我们先来想一下算法的数学形式（用变量 $v$ 表示运算结果）： $w (ab) + (1 - w) (a + b) = v (w \in {0, 1})$ 这里有三个乘法，但是由于运算结构只支持一个乘法操作，所以这里至少就要做三次运算。我们先将它简化 :

 <span class="katex"><span class="katex-html" aria-hidden="true"><span class="base"><span class="strut" style="height:0.6667em;vertical-align:-0.0833em;"></span><span class="mord mathnormal" style="margin-right:0.02691em;">w</span><span class="mspace" style="margin-right:0.2222em;"></span><span class="mbin">×</span><span class="mspace" style="margin-right:0.2222em;"></span></span><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mopen">(</span><span class="mord mathnormal" style="color:green;">a</span><span class="mspace" style="margin-right:0.2222em;"></span><span class="mbin" style="color:green;">×</span><span class="mspace" style="margin-right:0.2222em;"></span></span><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord mathnormal" style="color:green;">b</span><span class="mclose">)</span><span class="mspace" style="margin-right:0.2222em;"></span><span class="mbin">+</span><span class="mspace" style="margin-right:0.2222em;"></span></span><span class="base"><span class="strut" style="height:0.6667em;vertical-align:-0.0833em;"></span><span class="mord mathnormal" style="color:blue;">a</span><span class="mspace" style="margin-right:0.2222em;"></span><span class="mbin" style="color:blue;">+</span><span class="mspace" style="margin-right:0.2222em;"></span></span><span class="base"><span class="strut" style="height:0.7778em;vertical-align:-0.0833em;"></span><span class="mord mathnormal" style="color:blue;">b</span><span class="mspace" style="margin-right:0.2222em;"></span><span class="mbin">−</span><span class="mspace" style="margin-right:0.2222em;"></span></span><span class="base"><span class="strut" style="height:0.6667em;vertical-align:-0.0833em;"></span><span class="mord mathnormal" style="margin-right:0.02691em;">w</span><span class="mspace" style="margin-right:0.2222em;"></span><span class="mbin">×</span><span class="mspace" style="margin-right:0.2222em;"></span></span><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mopen">(</span><span class="mord mathnormal" style="color:green;">a</span><span class="mspace" style="margin-right:0.2222em;"></span><span class="mbin" style="color:green;">+</span><span class="mspace" style="margin-right:0.2222em;"></span></span><span class="base"><span class="strut" style="height:1em;vertical-align:-0.25em;"></span><span class="mord mathnormal" style="color:green;">b</span><span class="mclose">)</span><span class="mspace" style="margin-right:0.2778em;"></span><span class="mrel">=</span><span class="mspace" style="margin-right:0.2778em;"></span></span><span class="base"><span class="strut" style="height:0.4306em;"></span><span class="mord mathnormal" style="margin-right:0.03588em;">v</span></span></span></span>

$\Rightarrow w \times (a \times b - a - b) = v - a - b$

写出 :

$1 \cdot a \times 1 \cdot b = 1 \cdot m$
$1 \cdot w \times (1 \cdot m + - 1 \cdot a + - 1 \cdot b) = 1 \cdot v + - 1 \cdot a + - 1 \cdot b$
$1 \cdot w \times 1 \cdot w = 1 \cdot w (res t r i c t w \in {0, 1} b y w \cdot (w - 1) = 0$

第 3 条是增加的约束使 $w$ 必须为二进制，否则 $P$ 就可以代入任何值去执行恶意运算

现在一共有 5 个变量 ( 2 个左操作符 $a, w$ ， 4 个右操作符 $a, b, m, w$ 和 5 个输出 $v, a, b, m, w$ ) , 操作符多项式为：

$L (x) = a \cdot l_{a} (x) + w \cdot l_{w} (x)$
$R (x) = m \cdot r_{m} (x) + a \cdot r_{a} (x) + b \cdot r_{b} (x)$
$O (x) = m \cdot o_{m} (x) + v \cdot o_{v} (x) + a \cdot o_{a} (x) + b \cdot o_{b} (x)$

在在三次运算中, 必须为每个变量多项式 都分别算出一个对应的系数, 或者如果这个多项式在计算的操作数或者输出中没有被用到的话, 系数就置为 0 :

如上图

对于左操作数 : a 在第 1 行约束出现, 所以 $L (1) = 1, L (2) / L (3) = 0$ , w 在第 2/3 行约束出现, 所以 $L (1) = 0, L (2) / L (3) = 1$ ,
对于右操作数 : 注意第 2 行约束的 $r_{a} (2) = - 1$

因为有三行约束, 所以 target poly 就是 $t (x) = (x -1) (x -2) (x -3)$

Next we leverage polynomial interpolation to find each variable polynomial :

$l_{a} (x) = {(1, 1), (2, 0), (3, 0)} = \frac{1}{2} x^{2} - \frac{5}{2} x + 3$
$l_{w} (x) = {(1, 0), (2, 1), (3, 1)} = - \frac{1}{2} x^{2} + \frac{5}{2} x - 2$
$r_{m} (x) = - x^{2} + 4 x - 3$
$r_{a} (x) = x^{2} - 4 x + 3$
$r_{b} (x) = \frac{3}{2} x^{2} - \frac{13}{2} x + 6$
$r_{w} (x) = \frac{1}{2} x^{2} - \frac{3}{2} x + 1$
$o_{m} (x) = \frac{1}{2} x^{2} - \frac{5}{2} x + 3$
…

绘制出来就是：

OK! Now we are ready to prove computation through polynomials.

首先，选择函数的输入值，例如： $w = 1, a = 3, b = 2$ 。其次，计算过程中的中间变量值为：

$m = a \times b = 6$
$v = w (m - a - b) + a + b = 6$

然后，我们把所有计算结果中的值赋值到 变量多项式 (variable polynomial) 中，然后相加得到操作数或者输出多项式的形式：

$L (x) R (x) O (x) = 3 \cdot l_{a} (x) + 1 \cdot l_{w} (x) = 3 \cdot (\frac{1}{2} x^{2} - \frac{5}{2} x + 3) + - \frac{1}{2} x^{2} + \frac{5}{2} x - 2 = x^{2} - 5 x + 7 = 6 \cdot r_{m} (x) + 3 \cdot r_{a} (x) + 2 \cdot r_{b} (x) + 1 \cdot r_{w} (x) = \frac{1}{2} x^{2} - \frac{5}{2} x + 4 = 6 \cdot o_{m} (x) + 6 \cdot o_{v} (x) + 3 \cdot o_{a} (x) + 2 \cdot o_{b} (x) + 1 \cdot o_{w} (x) = 2 \frac{1}{2} x^{2} - 12 \frac{1}{2} x + 16 = \frac{5}{2} x^{2} - \frac{25}{2} x + 16$

注意: $l_{a} (x) 、 l_{w} (x)$ 的系数是其赋值, 比如 $l_{w} (x) 、 r_{w} (x) 、 o_{w} (x)$ 的系数都是 1 , $l_{a} (x) 、 r_{a} (x) 、 o_{a} (x)$ 的系数都是 3 … $l_{m} (x) 、 r_{m} (x) 、 o_{m} (x)$ 的系数则是 2×3 => 6

在图中就表示为：

上图表示的, 就是 上上图 里的 $l_{a} (x) 、 l_{w} (x)$ 等都被 “拉长了” , 拉长成了 $3 \cdot l_{a} (x) 、 6 \cdot o_{m} (x)$

把他们具体组合成 $L (x) 、 R (x) 、 O (x)$ , 即相加对应操作数如 $3 \cdot l_{a} (x) + 1 \cdot l_{w} (x)$ …

Recap 上图: $w = 1, a = 3, b = 2$ :

$L (X) = x^{2} - 5 x + 7$ 经过了 ${(1, 3_{a}), (2, 1_{w}), (3, 1_{w})}$
$R (X) = \frac{1}{2} x^{2} - \frac{5}{2} x + 4$ 经过了 ${(1, 2_{b}), (2, 6_{m} - 3_{a} - 2_{b}), (3, 1_{w})}$
$O (X)$ 则经过了 ${(1, 6_{m}), (2, 6_{v} - 3_{a} - 2_{b}), (3, 1_{w})}$

$2_{a}$ 表示给 $a$ 这个变量赋值为 2

我们需要去证明 $L (x) \times R (x) - O (x) = t (x) h (x)$ ，因而我们先 长除法 找出 $h (x)$ :

$h (x) = \frac{L ( x ) \times R ( x ) - O ( x )}{t ( x )} = \frac{\frac{1}{2} x ^{4} - 5 x ^{3} + \frac{35}{2} x ^{2} - 25 x + 12}{( x - 1 ) ( x - 2 ) ( x - 3 )} = \frac{1}{2} x - 2$

以图的形式表示为：

图示很明显, 多项式 $L (x) \times R (x) - O (x)$ 有根为 : $x = 1, x = 2, x = 3$ ，因而 $t (x)$ 是它的因式，假如使用了和它不一致的变量值，情况就不是这样了

这就是一组能够正确计算的变量值，如何在多项式层面上证明出来的。下面 $P$ 还要再继续处理协议的密码学部分

Verifiable Computation Protocol (可验证计算协议 )

我们基于前文中多项式知识协议 做了很多修改使它变得更通用 (general-purpose)，来看一下它现在的定义

假设约定函数 f(*)，约定其计算结果为证明对象(proof)，其次数为 $d$ ，变量数为 $n$ ，其对应的系数: ${c_{L, i, j}, c_{R, i, j}, c_{o, i, j}}_{i \in {1, \dots, d}, j \in {i, \dots, d}}$ Setup :

为左操作数 ${l_{i} (x)}_{i \in {1, \dots, n}}$ (类似 $l_{a} (x), l_{d} (x), ..$ ) 构造变量多项式(variable polynomial) 然后对于所有 $j \in {1, \dots, d}$ 的运算都算出其对应的系数，即 $l_{i} (j) = c_{L, i, j}$ , 对右操作数和输出也做同样的事情。 $类似 r_{m} (2) = - 1; r_{a} (2) = 1$ 这样的
随机抽取 $s, α$
计算 $t (x) = (x - 1) (x - 2) \dots (x - d)$ 及 $g^{t (s)}$
计算 proving key：
- $({g^{s^{k}}}_{k \in [d]}, {g^{l_{i} (s)}, g^{r_{i} (s)}, g^{o_{i} (s)}, g^{α l_{i} (s)}, g^{α r_{i} (s)}, g^{α o_{i} (s)}}_{i \in {1, \dots\dots, n}})$
计算 verification key ： $(g^{t (s)}, g^{α})$

Proving :

compute function f(*) and therefore corresponding variables values ${v_{i}}_{i \in {1, \dots, n}}$
- 我理解这里就是 $n$ 个变量每个变量的赋值即 witness
计算 $h (x) = \frac{L ( x ) \times R ( x ) - O ( x )}{t ( x )}$ ，其中 $L (x) = \sum_{i = 1}^{n} v_{i} \cdot l_{i} (x)$ ， $R (x) 、 O (x)$ 也是类似处理
给 $n$ 个变量赋值 $v_{1}, \dots, v_{n}$ 求和, 得到 operand poly ： $g^{L (s)} g^{R (s)} g^{O (s)} = (g^{l_{1} (s)})^{v_{1}} \cdot \dots \cdot (g^{l_{n} (s)})^{v_{n}}, = i = 1 \prod n (g^{r_{i} (s)})^{v_{i}}, = i = 1 \prod n (g^{o_{i} (s)})^{v_{i}}$
assign variable values to the shifted poly : $g^{αL (s)} = i = 1 \prod n (g^{α l_{i} (s)})^{v_{i}}, g^{α R (s)} = i = 1 \prod n (g^{α r_{i} (s)})^{v_{i}}, g^{α O (s)} = i = 1 \prod n (g^{α o_{i} (s)})^{v_{i}}$
使用 $s$ 的幂加密值： ${g^{s^{k}}}_{k \in [d]}$ 计算加密值 $g^{h (s)}$ 给 $V$
set proof
${g^{L (s)}, g^{R (s)}, g^{O (s)}, g^{α L (s)}, g^{α R (s)}, g^{α O (s)}, g^{h (s)}}$

Verification :

parse proof as $(g^{L}, g^{R}, g^{O}, g^{L^{'}}, g^{R^{'}}, g^{O^{'}}, g^{h})$
variable polynomial restriction check (要符合 α-shifted ) $e (g^{L}, g^{α}) e (g^{R}, g^{α}) e (g^{O}, g^{α}) = e (g^{L^{'}}, g), = e (g^{R^{'}}, g), = e (g^{O^{'}}, g)$
valid operation check (计算结果的有效性) $e (g^{L}, g^{R}) e (g, g)^{L + R} e (g, g)^{L + R} = ? e (g^{t}, g^{h}) \cdot e (g^{O}, g) = ? g^{t \cdot h + O} = ? e (g, g)^{t \cdot h + O}$

The set of all the variable polynomials ${l_{i} (x), r_{i} (x), o_{i} (x)}$ for $i \in {1, \dots, n}$ and the target polynomial $t (x)$ is called a quadratic arithmetic program (QAP, introduced in Gen+12 ).

虽然协议足够健壮，可以进行常规的计算验证，但这里依然还有两个安全考虑需要去解决。

2 security considerations

1 | Non-Interchangeability of Operands and Output

操作数和输出的不可替代性

Because we use the same $α$ for all operands of variable polynomials restriction check , there is nothing that prevents $P$ from

使用其它的操作数中的可变多项式，即 $L^{'} (s) = o_{1} (s) + r_{1} (s) + r_{1} (s) + \dots$
完全交换操作数多项式，也就是把 $O (s)$ 和 $L (s)$ 换成 $O (s) \times R (s) = L (s)$
复用相同的操作数多项式，即 $L (s) \times L (s) = O (s)$

可交换性就是指 $P$ 可以修改计算过程，并有效证明一些其它无关的计算结果。防止这种行为的一个很显然的方式就是在不同的操作数上使用不同的 $α s$ ，具体协议就可以修改为：

选择随机数 $α_{l}, α_{r}, α_{o}$ 来代替 $α$

Setup :

sample random $α_{l}, α_{r}, α_{o}$ instead of $α$
calculate corresponding shifts ${g^{α_{l} l_{i} (s)}, g^{α_{r} r_{i} (s)}, g^{α_{o} o_{i} (s)}}_{i \in {1 \dots n}}$
Proving key : $(g^{t (s)}, g^{α_{l}}, g^{α_{r}}, g^{α_{o}})$ Proving :
…
assign variables to the shifted poly : $g^{α_{l} L (s)} = i = 1 \prod n (g^{α_{l} l_{i} (s)})^{v_{i}}, g^{α_{r} R (s)} = i = 1 \prod n (g^{α_{r} r_{i} (s)})^{v_{i}}, g^{α_{o} O (s)} = i = 1 \prod n (g^{α_{o} o_{i} (s)})^{v_{i}}$ It is now not possible to use variable polynomials from other operands since following α-s are not known to the prover: (这样就不能在一个操作数中使用其它操作数(operands) 的变量多项式了，因为 prover 没有办法去获知 $α_{l}, α_{r}, α_{o}$ 来满足 $α_{s}$ 变换关系 )

even@安比实验室: 这里通过对 $l (x), r (x)$ 和 $o (x)$ 进行分开 KEA 检查，就解决了上篇文章中提出的第二个缺陷问题——由于 prover 生成的证明中只有计算结果，左操作数，右操作数，输出在计算中混用也不会被发现。

同样下面一节也解决了上篇文章中提出的第三个缺陷问题——由于左操作数，右操作数，输出是分开表示的，互相之间的关系无法进行约束

2 | Variable Consistency Across Operands(一致性校验和)

跨操作数的变量一致性

For any variable $v_{i}$ we have to assign its value to a variable polynomial for each corresponding operand, i.e.: ( 对于任意的变量 $v_{i}$ ，我们都必须将它的值分配到每个相应操作数中的一个与之对应的 变量多项式 上，即：) $(g^{l_{i} (s)})^{v_{i}}, (g^{r_{i} (s)})^{v_{i}}, (g^{o_{i} (s)})^{v_{i}}$ Because the validity of each of the operand polynomials is checked separately, no enforcement requires to use same variable values in the corresponding variable polynomials. This means that the value of variable $v_{i}$ in left operand can differ from variable $v_{i}$ in the right operand or the output. ( 因为每一个 operand polynomials 的有效性是分开校验的，并不强制要求我们在对应的 variable polynomials 中使用相同的变量值。这就意味着在左操作数中变量 $v_{i}$ 的值可以与右操作数或输出中的变量值 $v_{1}$ 不同)

我们可以通过熟悉的限制多项式的方法（也就是限制变量多项式的方法）在操作数之间强制变量值相等。

If we can create a “shifted checksum” variable polynomial across all operands, that would restrain prover such that he can assign only same value. A verifier can combine polynomials for each variable into one, e.g., ( 如果我们能够在所有的操作数之间创造一个作为“变换的校验和”(shifted checksum) 的变量多项式(variable polynomial)，(这里我理解就是创建一个包含了所有 variable 的 variable poly, 对这些所有的 variable 整体做 α-shift, 就一个都别跑都被约束住了) 那么就可以限制 $P$ 使其只能够赋予(给每个变量)相同的值。 $V$ 可以将这些每个变量的多项式加起来，即： $s hi f t e d c h ec k s u m v a r iab l e p o l y : g^{l_{i} (s) + r_{i} (s) + o_{i} (s)}$ 然后乘以一个额外的随机数 β ，即 $g^{β (l_{i} (s) + r_{i} (s) + o_{i} (s))}$ 提供这些 β-shifted poly 给 $P$ ，与变量多项式一起给它赋上变量值： $(g^{l_{i} (s)})^{v_{L, i}}, (g^{r_{i} (s)})^{v_{R, i}}, (g^{o_{i} (s)})^{v_{O, i}}, (g^{β (l_{i} (s) + r_{i} (s) + o_{i} (s))})^{v_{β, i}}$ 然后加密 β 并把 $g^{β}$ 加到 verification key 中。现在如果所有的 $v_{i}$ 值相同，即, $v_{L, i} = v_{R, i} = v_{o, i} = v_{β, i} 其中 i \in {1, \dots, n}$ 等式就满足： $e (g^{v_{L, i} \cdot l_{i} (s)} \cdot g^{v_{R, i} \cdot r_{i} (s)} \cdot g^{v_{O, i} \cdot o_{i} (s)}, g^{β}) β \cdot (v_{L, i} \cdot l_{i} (s) + v_{R, i} \cdot r_{i} (s) + v_{O, i} \cdot o_{i} (s)) = e (g^{v_{β, i} \cdot β (l_{i} (s) + r_{i} (s) + o_{i} (s))}, g) = v_{β, i} \cdot β (l_{i} (s) + r_{i} (s) + o_{i} (s)) (1) (2)$

(2) 式的底 $e (g, g)$ 被暂时忽略省去了

如上, $(1), (2)$ 式成立的条件是 : 当且仅当 $v_{L, i} 、 v_{R, i} 、 v_{O, i} 和 v_{β, i}$ 都相等时，这个等式才会成立

尽管这个一致性校验很有用，但还是存在一定的概率 $l (s), r (s), o (s)$ 中至少有两项要么计算值相同, 要么一个多项式可以被另一个整除等情况，这就允许 $P$ 去分解 $v_{L, i}, v_{R, i}, v_{O, i}, v_{β, i}$ 这些值的关系，使得即使有至少两个不相等的值也依然能够保持等式成立，从而使上 $(2)$ 式的校验无效

例如，一个以 $l (x) = r (x)$ 为例的单个运算。我们用 w 来表示这 2 式的评估, 同时令 $o (s) = y$ 。这个等式看起来就是： $β (v_{L} w + v_{R} w + v_{O} y) = ? v_{β} \cdot β (w + w + y)$

对于任意的 $v_{R}$ 和 $v_{O}$ ，这种形式可以令 $v_{β} = v_{o}, v_{L} = 2 v_{o} - v_{R}$ ，上式也就变换成： $β (2 v_{o} w - v_{R} w + v_{R} w + v_{o} y) β (2 v_{o} w + v_{o} y) v_{o} \cdot β (2 w + y) = ? v_{o} \cdot β (2 w + y) = ? v_{o} \cdot β (2 w + y) = v_{o} \cdot β (2 w + y) \leftarrow 恒成立$ 所以说, 如果 $P$ 刻意让 $v_{β} = v_{o}, v_{L} = 2 v_{o} - v_{R}$ , 则这样的一致性策略是恒成立/无效的。缓解这种情况的一种方法是对每个操作数都使用不同的 $β$ ， 确保操作数的 变量多项式 中包含无法预测的值

以下是修改后的协议：

Setup

…随机数 $β_{l}, β_{r}, β_{o}$
对 variable consistency poly(变量一致性多项式) 进行计算，加密并添加到 proving key 中： ${g^{β_{l} l_{i} (s) + β_{r} r_{i} (s) + β_{o} o_{i} (s)}}_{i \in {1, \dots, n}}$
对 $β_{S}$ 加密并将其加到 verification key 中： $(g^{β_{l}}, g^{β_{r}}, g^{β_{o}})$

Proving

…assign variable values to variable consistency poly : $g^{z_{i} (s)} = (g^{β_{l} l_{i} (s) + β_{r} r_{i} (s) + β_{o} o_{i} (s)})^{v_{i}} f or i \in {1, \dots, n} (别忘了 n 是变量个数)$
add assigned polys in encrypted space : (将赋值的多项式加加密空间中):
- 对每一个变量 $v_{i}$ ，都要计算它的一致性校验和(shifted-checksum) $z_{i} (s)$ ，然后我们将所有的 $z_{i} (s)$ 的值相乘, 得到 $g^{Z (s)}$ $g^{Z (s)} = i = 1 \prod n g^{z_{i} (s)} = g^{β_{l} L (s) + β_{r} R (s) + β_{o} O (s)}$
add to the proof： $g^{Z (s)}$

在这后面增加吗? ${g^{L (s)}, g^{R (s)}, g^{O (s)}, g^{α L (s)}, g^{α R (s)}, g^{α O (s)}, g^{h (s)}}$

Verification

…校验提供的 操作数多项式 和 “校验和”多项式之间的一致性： $e (g^{L}, g^{β_{l}}) \cdot e (g^{R}, g^{β_{r}}) \cdot e (g^{O}, g^{β_{o}}) e (g, g)^{β_{l} L + β_{r} R + β_{o} O} = ? e (g^{Z}, g) = ? e (g, g)^{Z}$ PS: Pairing 公式参考 : $e (g^{a}, g^{b}) \cdot e (g^{c}, g^{d}) = g^{ab} \cdot g^{c d} = g^{ab + c d} = e (g, g)^{ab + c d}$

这个构造中, 同一个变量值就无法乱用了，因为不同的 $β_{S}$ 使得相同多项式无法兼容，但是这里还存在与 remark 4.1 相同的缺陷，由于 $(g^{β_{l}}, g^{β_{r}}, g^{β_{o}})$ 是公开可见的，攻击者可以修改任意变量多项式的零索引系数(modify the zero-index coefficient of any of the variable polynomials)，因为它并不依赖于 $s$ ，i.e. $g^{β_{l} s^{0}} = g^{β_{l}}$

变量非延展性和变量一致性多项式

(Non-malleability of Variable and Variable Consistency Polynomials)

1 | 变量多项式的延展性

Recall 第三章的 Remark 4.1 : $P$ 可以在操作数多项式上分配一个 $v^{'}$ ，而 $V$ 不能检测到 , 下面具体描述了 $P$ 对多项式进行特定加（或减）操作的能力，而这种操作不会影响 $V$ 配对验证 , 因而可以修改多项式使其超出 $V$ 的预期或 prove a different statement，后面的章节我们将会解决掉这个问题 : $P : g^{v l (s)} \cdot g^{v^{'}} = g^{v l (s) + v^{'}} V : g^{αv l (s)} \cdot (g^{α})^{v^{'}} = g^{α (v l (s) + v^{'})} V : e (g^{α (v l (s) + v^{'})}, g) = e (g^{v l (s) + v^{'}}, g^{α}) \leftarrow 恒等$ 由于 verification key 中包含了加密了的 $α$ : $g^{α}$ ，所以 $P$ 可以用多项式加（或者减）任意一个值 $v^{'}$ 而不会破坏 Pairing 的成立. 后面我们会解决掉这个 bug

举一个 remark 4.1 有关的例子，看一下下面的两个运算： $a \times 1 = b 3 a \times 1 = c$ 预期的结果 b = a 和 c = 3a , 即 c = 3b。这就是说 left operand’s variable polynomial 的计算结果为 $l_{a} (1) = 1$ 和 $l_{a} (2) = 3$ (第 $1$ 行约束的系数为 $1$ , 第 $2$ 行的约束为 $3$ )

先不管 $l_{a} (x)$ 的形式， $P$ 都可以不按照上述的比例用另一个修改了的多项式 $l_{a}^{'} (x) = a l_{a} (x) + 1$ 来给 $a$ 赋值。这样运算就变成了 $l_{a}^{'} (1) = a + 1$ 和 $l_{a}^{'} (2) = 3 a + 1$ , 结果也就是 b = a + 1 和 c = 3a + 1，其中 c ≠ 3b ，这意味着 $a$ 的取值的实际意义在不同运算中是不一样的

但是因为 $P$ 已经拿到了 $g^{α_{l}}$ 和 $g^{β_{l}}$ ，所以他依然能够正确地通过 correct operand polynomials 和 variable values consistency 的校验：

…Proving：

用分配不成比例的变量 a 来建立左操作数多项式： $L (x) = a \cdot l_{a} (x) + 1$
按照常规的方式构造右操作数多项式和输出多项式： $R (x) = r_{1} (x), O (x) = b \cdot o_{b} (x) + c \cdot o_{c} (x)$
计算除数： $h (x) = \frac{L ( x ) \cdot R ( x ) - O ( x )}{t ( x )}$
计算加密值： $g^{L (s)} = (g^{l_{a} (s)})^{a} \cdot g^{1}$ ，并按照常规方式计算 $g^{R (s)}, g^{O (s)}$
计算 α-shifts 的加密值： $g^{αL (s)} = (g^{α l_{a} (s)})^{a} \cdot g^{α}$ ，并按照常规方式计算 $g^{α R (s)}, g^{α O (s)}$
计算变量一致性多项式：

$g^{Z (s)} = i \in {1, a, b, c} \prod (g^{β_{l} l_{i} (s) + β_{r} r_{i} (s) + β_{o} O_{i} (s)})^{i} \cdot g^{β_{l}} = g^{β_{l} (L (s) + 1) + β_{r} R (s) + β_{o} O (s)}$

其中下标 $i$ 代表对应变量的符号, 指数 $i$ 代表变量的值；以及未定义的变量多项式的值为 0。

set proof : $(g^{L (s)}, g^{R (s)}, g^{O (s)}, g^{α_{l} L (s)}, g^{α_{r} R (s)}, g^{α_{o} O (s)}, g^{Z (s)}, g^{h (s)})$

Verification：

variable poly restriction check : $e (g^{L^{'}}, g) e (g^{α a \cdot l_{a} (s) + α}, g) = ? e (g^{L}, g^{α}) \Rightarrow = ? e (g^{a l_{a} (s) + 1}, g^{α})$ and as usually for $g^{R^{'}}, g^{O^{'}}$
变量多项式约束检查： $e (g^{L}, g^{β_{l}}) \cdot e (g^{R}, g^{β_{r}}) \cdot e (g^{O}, g^{β_{o}}) e (g, g)^{(a \cdot l_{a} + 1) β_{l} + R β_{r} + O β_{o}} = e (g^{Z}, g) = e (g, g)^{β_{l} (L + 1) + β_{r} R + β_{o} O}$
有效计算检查： $e (g^{L}, g^{R}) = e (g^{t}, g^{h}) \cdot e (g^{O}, g)$

2 | Malleability of Variable Consistency Polynomials(变量一致性多项式的延展性)

Moreover, $(g^{β_{l}}, g^{β_{r}}, g^{β_{o}})$ allows to use different values of same variable in different operands. For example, if we have an operation: (而且 $(g^{β_{l}}, g^{β_{r}}, g^{β_{o}})$ 的存在允许我们在不同操作数的相同变量上使用不同的值。例如，如果我们有一个运算)： $a \times a = b$

Which can be represented by the variable polynomials: $l_{a} (1) = 1, r_{a} (1) = 1, o_{a} (1) = 0 l_{b} (1) = 0, r_{b} (1) = 0, o_{b} (1) = 1$ 简单插值, 得到 $l_{a} (x) = x, r_{a} (x) = x, o_{a} (x) = 0 l_{b} (x) = 0, r_{b} (x) = 0, o_{b} (x) = x$ 尽管我们期待的输出是 $b = a^{2}$ ，但我们可以设置不同的 $a$ 值，例如：设置 $a = 2$ (left operand), $a = 5$ (right operand) , $b = 10$ 如下：

Proving：

…用 $a = 2$ 设置左操作数多项式 $L (x) = 2 l_{a} (x) + 10 l_{b} (x)$
用 $a = 5$ 设置右操作数多项式 $R (x) = 2 r_{a} (x) + 3 + 10 r_{b} (x)$
- $∵ 2 \cdot r_{a} (x) = 2$ (在 $x = 1$ 时) , 所以 +3 是为了确保我们在 $x = 1$ 处得到正确的操作数 5
用 $b = 10$ 设置输出多项式 : $O (x) = 2 o_{a} (x) + 10 o_{b} (x)$
… 计算加密值 : $g^{L (s)} = (g^{l_{a} (s)})^{2} \cdot (g^{l_{b} (s)})^{10} = g^{2 l_{a} (s) + 10 l_{b} (s)} g^{R (s)} = (g^{r_{a} (s)})^{2} \cdot (g)^{3} \cdot (g^{r_{b} (s)})^{10} = g^{2 r_{a} (s) + 3 + 10 r_{b} (s)} g^{O (s)} = (g^{O_{a} (s)})^{2} \cdot (g^{O_{b} (s)})^{10} = g^{2 o_{a} (s) + 10 o_{b} (s)}$
计算变量一致性多项式： $g^{Z (s)} = (g^{β_{l} l_{a} (s) + β_{r} r_{a} (s) + β_{o} o_{a} (s)})^{2} \cdot (g^{β_{r}})^{3} \cdot (g^{β_{l} l_{b} (s) + β_{r} r_{b} (s) + β_{o} o_{b} (s)})^{10} = g^{β_{l} (2 l_{a} (s) + 10 l_{b} (s)) + β_{r} (2 r_{a} (s) + 3 + 10 r_{b} (s)) + β_{o} (2 o_{a} (s) + 3 + 10 o_{b} (s))}$ Verification：
……变量值的一致性检查，应满足： $e (g^{L}, g^{β_{l}}) \cdot e (g^{R}, g^{β_{r}}) \cdot e (g^{O}, g^{β_{o}}) = e (g^{Z}, g)$

注意：多项式 $o_{a} (x) ， l_{b} (x) ， r_{b} (x)$ 其实可以被忽略掉的，因为这几项对于任何 $x$ 的取值，计算结果都为 0，但是为了保持完整性我们依然要保留这几项

even@安比实验室：这种能力会危害到协议的可靠性。很显然，加密的 $β_{s}$ 不应该对 Prover 可见

3 | Non-Malleability 非延展性

解决延展性(Malleability) 问题的一个方法就是，在 setup 阶段将 encrypted space中的 $β_{s}$ 项与随机秘密值 $γ$ (gamma) 相乘, 从而使 verification key 中加密的 $β_{s}$ 与加密值 $Z (s)$ 不兼容： $g^{β_{l} γ}, g^{β_{r} γ}, g^{β_{o} γ}$ 相应的这种被修饰过的加密值，就能阻止修改加密值 $Z (s)$ 的可行性，因为 $Z (s)$ 中没有 $γ$ ，即： $g^{Z (s)} \cdot g^{v^{'} \cdot β_{l} γ} = g^{β_{l} (L (s) + v^{'} γ) + β_{r} R (s) + β_{o} O (s)}$

注 : $g^{Z (s)} = g^{β_{l} L (s) + β_{r} R (s) + β_{o} O (s)}$

因为变值 $γ$ 是随机的, $P$ 并不知道它的值。所以这个修改就需要我们用 $Z (s)$ 乘以 $γ$ 来平衡协议中的变量值一致性校验等式：

Setup：

…随机数 $β_{l}, β_{r}, β_{o}, γ$
…设置 verification key： $(\dots, g^{β_{l} γ}, g^{β_{r} γ}, g^{β_{o} γ}, g^{γ})$ Proving： … Verification：
… 变量值一致性检查应满足： $e (g^{L}, g^{β_{l} γ}) \cdot e (g^{R}, g^{β_{r} γ}) \cdot e (g^{O}, g^{β_{o} γ}) = e (g^{Z}, g^{γ})$ 这里很重要的一点是我们排除了变量多项式为 0-阶的例子（e.g. $l_{1} (x) = 1 x^{0}$ ），否则就可以从 proving key 的 variable consistency polynomials (变量一致性多项式) 中揭露出加了密的 $β$ 值 ${g^{β_{l} l_{i} (s) + β_{r} r_{i} (s) + β_{o} o_{i} (s)}}_{i \in {1, \dots, n}}$ 比如这个例子中当操作数(Operand) / 输出(Output) 中的任意两项为 $0$ 时, e.g. $l_{1} (x) = 1, r_{1} (s) = 0, o_{1} (s) = 0$ , this will result in : $g^{β_{l} l_{1} (s) + β_{r} r_{1} (s) + β_{o} o_{1} (s)} = g^{β_{l}}$ 如此 $g^{β_{l}}$ 就直接被 exposed 出来了

我们同样也可以通过“修饰“(mask) α-s 项来解决变量多项式的延展性问题。但是这就没有必要了，因为对于 变量多项式 的任何修改，都需要被映射到变量的 一致性多项式 中，而一致性多项式是无法修改的

变量值一致性检查的优化

现在 variable values consistency check 是有效的，但是这里在 verification key 中增加了 4 个昂贵的 Pairing 操作和 4 个新的项。文献 Par+13 中的 Pinocchio 协议用了一个很聪明的方法优化，通过选择不同的生成元 $g$ ，从而对每个 operand 实行“移位”：

Setup

…选择随机值 $β, γ, ρ_{l}, ρ_{r}$ , and set $ρ_{o} = ρ_{l} \cdot ρ_{r}$
set generators $g_{l} = g^{ρ_{l}}, g_{r} = g^{ρ_{r}}, g_{o} = g^{ρ_{o}}$
set proving key： $({g^{s^{k}}}_{k \in [d]}, {g_{l}^{l_{i} (s)}, g_{r}^{r_{i} (s)}, g_{o}^{o_{i} (s)}, g_{l}^{α_{l} l_{i} (s)}, g_{r}^{α_{r} r_{i} (s)}, g_{o}^{α_{o} o_{i} (s)}, g_{l}^{β l_{i} (s)}, g_{r}^{β r_{i} (s)}, g_{o}^{β o_{i} (s)}}_{i \in [n]})$
设置 verification key： $(g_{o}^{t (s)}, g^{α_{l}}, g^{α_{r}}, g^{α_{o}}, g^{β γ}, g^{γ})$

Proving

…assign variable values : $g^{Z (s)} = \prod_{i = 1}^{n} (g_{l}^{β l_{i} (s)} \cdot g_{r}^{β r_{i} (s)} \cdot g_{o}^{β o_{i} (s)})^{v_{i}} = (g_{l}^{β L_{i} (s)} \cdot g_{r}^{β r_{i} (s)} \cdot g_{o}^{β o_{i} (s)})$ Verification
…变量多项式约束检查： $e (g_{l}^{L^{'}}, g) = e (g_{l}^{L}, g^{α_{l}})$ & 对 $g_{r}^{R}, g_{o}^{O}$ 做同样的检查
变量值约束检查： $e (g_{l}^{L} \cdot g_{r}^{R} \cdot g_{o}^{O}, g^{β γ}) = e (g^{Z}, g^{γ})$
有效运算检查： $e (g_{l}^{L}, g_{r}^{R}) e (g, g)^{ρ_{l} ρ_{r} L R} = e (g_{o}^{t}, g^{h}) e (g_{o}^{O}, g) = e (g, g)^{ρ_{l} ρ_{r} t h + ρ_{l} ρ_{r} O}$

生成元的这种随机化进一步增加了安全性，使得如 remark 4.1 中描述的 variable polynomials 延展性无效。因为对于故意的修改，它必须要么是 $ρ_{l}, ρ_{r} 或 ρ_{o}$ 原始值的倍数 , 要么就是不可直接用的加密值的倍数（假定, 如上文所述我们不去处理可能曝光加密后的值的 0 阶可变多项式）

这个优化使得 verification key 减少了 2 个项, i.e. $g^{β γ}$ instead of $g^{β_{l} γ}, g^{β_{r} γ}, g^{β_{o} γ}$ : $对比 {(g_{o}^{t (s)}, g^{α_{l}}, g^{α_{r}}, g^{α_{o}}, g^{β γ}, g^{γ}) (\dots, g^{β_{l} γ}, g^{β_{r} γ}, g^{β_{o} γ}, g^{γ})$ ，并且去除了 verification 步骤中的两个配对运算 : $对比 {e (g^{L}, g^{β_{l} γ}) \cdot e (g^{R}, g^{β_{r} γ}) \cdot e (g^{O}, g^{β_{o} γ}) = e (g^{Z}, g^{γ}) e (g_{l}^{L} \cdot g_{r}^{R} \cdot g_{o}^{O}, g^{β γ}) = e (g^{Z}, g^{γ})$

注意：这在 Jens Groth 2016 年的 paper Gro16 中有更进一步的改进

even@安比实验室: 至此，通用 zk-SNARK 协议的已经几乎构造完成了，本文可以归纳为以下几点：

协议中是如何增加可变系数的和如何做加减乘除运算的

协议如何保证操作数和输出的不可替代性

协议如何保证跨操作数的可变一致性

协议如何处理非延展性变量和变量一致性

协议中变量值一致性检查优化

Reference :

https://secbit.io/blog/2020/01/15/learn-zk-snark-from-zero-part-four/
https://medium.com/@imolfar/why-and-how-zk-snark-works-5-variable-polynomials-3b4e06859e30
https://medium.com/@imolfar/why-and-how-zk-snark-works-6-verifiable-computation-protocol-1aa19f95a5cc

作者：Maksym Petkus

翻译 & 注解：even@安比实验室（even@secbit.io）

校对：valuka@安比实验室

本系列文章已获作者中文翻译授权

翻译原链接

约束和公共输入 Constraints and Public Inputs

约束 Constraints

我们的分析主要集中在运算的概念上。但是，协议实际上不是去做”计算“，而是检验输出值是否是操作数正确运算得到的结果。所以我们称之为约束，即一个 $V$ 约束 $P$ 去为预定义的“程序”提供有效值，而无论这个“程序”是什么。多个约束组成的系统被称为“约束系统”（在我们的例子中这是一个一阶约束系统，或被称为 R1CS）

@Maksym（作者）：这里其实隐含了寻找所有正确答案的一个方法就是对所有可能的组合值进行一次暴力破解，然后只选择一个满足的约束，或者使用可满足约束的更精密的技术 con18 even@安比实验室：请注意这个约束是定义在算术电路，或者布尔电路上。因为这两类电路的可满足性问题是 NP-Complete 问题。

因而我们也可以使用约束来确保其它的关系。例如，如果我们想要确认变量 $a$ 的值只能为 0 或 1（即二进制数），我们可以用一个简单的约束去做这件事： $a \times a = c$ 我们也可以约束 $a$ 的值只能为 2： $(a - 2) \times 1 = 0$ 一个更复杂的例子是确保数字 $a$ 是一个 4-bit 的数字（也称为半字节 nibble），换句话说可以用 4 个bit 来表示出 $a$ , 我们也可以称这个为“确保取值范围” , 因为一个 4-bit 的数字可以代表 $2^{4}$ 的组合，因而也就是从 0 ~ 15 范围内的 16 个数字。如 $1011 = 1 \cdot 2^{3} + 0 \cdot 2^{2} + 1 \cdot 2^{1} + 1 \cdot 2^{0} = 11$

Therefore if $a$ is a 4-bit number, then $a = b_{3} \cdot 2^{3} + b_{2} \cdot 2^{2} + b_{1} \cdot 2^{1} + b_{0} \cdot 2^{0}$ ，for some boolean $b_{3}, b_{2}, b_{1}, b_{0}$ , The constraint can be following: $a \times 1 = 8 b_{3} + 4 b_{2} + 2 b_{1} + 1 b_{0} (1)$ 并且为了确保 $b_{3}, b_{2}, b_{1}, b_{0}$ 都是二进制数我们需要增加约束： $b_{0} \times b_{0} = b_{0} \dots b_{2} \times b_{2} = b_{2} b_{3} \times b_{3} = b_{3} (2) (3) (4)$ 可以写成 Circom 代码:

#![allow(unused)]
fn main() {
a * 1 = 8*b3 + 4*b2 + 2*b1 + 1*b0
b0 * b0 = b0
b1 * b1 = b1
b2 * b2 = b2
b3 * b3 = b3
}

更复杂的约束也可以用这种方式表示，以此来确保使用的值满足规则。需要注意的是，上述约束 $(1)$ 在当前操作的构造中是不可能的： $i = 1 \sum n c_{l, i} \cdot v_{i} \times i = 1 \sum n c_{r, i} \cdot v_{i} = i = 1 \sum n c_{o, i} \cdot v_{i}$ 因为值 1 （以及前面约束中的 2）必须通过 $c \cdot v_{o n e}$ 表达出来，其中 c 可以被固定到 proving key 中，但是因为 v 是由 $P$ 提供的，所以可以是任何别的值。尽管我们可以通过设置 c = 0 来强制 $c \cdot v_{o n e}$ 变成 0，但是在我们前面受限的构造方法中很难找到一个约束来强制 $v_{o n e}$ 为 1。于是， $V$ 需要有一种办法来设置 $v_{o n e}$ 的值

首先，我们需要明确 $v_{o n e}$ 这个特殊变量的角色。在 zk-SNARK的约束系统中，它是被预设为 1 的。换句话说，无论其他变量如何变化， $v_{o n e}$ 的值始终应该是1。

然后，该部分内容提到的 $c \cdot v_{o n e}$ ，实际上是约束系统中的一个公式，其中 $c$ 是证明者在证明过程中需要选择的一个值， $v_{o n e}$ 是我们前面说的那个始终为 1 的特殊变量。

然后，它提到，即使我们可以通过设置 $c = 0$ 来使得 $c \cdot v_{o n e}$ 为0，但在当前的构造方法中，我们却无法找到一个约束来强制 $v_{o n e}$ 为 1 。这个意思是说，在我们的构造方法中，我们可以通过选择不同的 $c$ 使得 $c \cdot v_{o n e}$ 为任何我们希望的值，但这并不能保证 $v_{o n e}$ 始终为1

even@安比实验室: 我们前文中提到的表达式的约束关系就称为 R1CS

Public Inputs and One (公共输入和 1)

如果不能根据 $V$ 的输入对其进行检查，例如，知道证明者已将两个值相乘而不知道结果和/或值是什么，那么证明的可用性将受到限制。虽然可以在 proving key 中通过“硬编码(hardwire)”来进行验证一些特定的值（如，约束某步乘法运算的结果必须为 12 ），但这就需要针对每一个所需的的 “verifier 输入”生成单独的密钥对 (this would require to generate separate pair of keys for each desired “verifier’s input.”)

even@安比实验室: 这样会严重限制实用性，电路需要支持参数。

因而如果可以由 $V$ 为计算指定一些值(输入/输出)，包括 $v_{o n e}$ ，而不是由 $P$ 来控制, 那证明就可以变得更通用!! (Therefore it would be universal if the verifier could specify some of the values (inputs or/and outputs) for the computation, including the $v_{o n e}$ , instead of the $P$ .)

首先，我们看一下要证明的值 $g^{L (s)}, g^{R (s)}, g^{O (s)}$ Because we are using the homomorphic encryption it is possible to augment these values, for example, we can add another encrypted polynomial evaluation (利用同态加密，我们可以扩大这些值) $g^{L (s)} \cdot g^{l_{v} (s)} = g^{L (s) + l_{v} (s)}$ which means that the verifier could add other variable polynomials to the already provided ones. Therefore if we could exclude necessary variable polynomials from the ones available to the prover, the verifier would be able to set his values on those variables, while the computation check should still match. 这意味着验证者 $V$ 可以将 other variable polynomials 添加到已经提供的 polys 中。因此，如果我们可以从提供给 $P ro v er$ 的变量多项式中, 排除(exclude) necessary variable polys, 验证者 $V$ 将能够在这些变量上设置他的值，而计算检查应该仍然匹配。

也就是说, 这样如果我们能够在提供给 $P$ 的变量多项式中排除必要的一项， $V$ 就可以在这一项变量多项式上设置他自己的值，并且使得检查依然能够通过

It is easy to achieve since the $V$ is already constraining the prover in the choice of polynomials he can use empolying the α-shift. Therefore those variable polynomials can be moved from the proving key to the verification key while eliminating its α-s and β checksum counterparts. 这很容易实现，因为 $V$ 已经限制了 $P$ 选择他可以使用 α-shift 的多项式。因此，这些可变多项式可以从 proving key 转移到 verification key ，同时消除其 α-s 和 β 校验和对应项。

也就是说, 因为 $V$ 早已能通过加入 α-shift 来限制 $P$ 选择多项式，所以这个应该很容易实现。因而当消除了它的 $α - s$ 和 $β$ 校验和对应的项，这些可变多项式就可以从 proving key 转移到 verification key 当中去了

必要的协议更新为：

Setup (需自行对比 former protocol version)

…将 $n$ 个 variable polys 全部分为两组：
- $V$ 的 $m + 1$ 项： $L_{v} (x) = l_{0} (x) + l_{1} (x) + \dots + l_{m} (x)$ , 对 $R_{v} (x)$ 和 $O_{v} (x)$ 也做同样的计算。这里对于索引 0 保留值 $v_{o n e} = 1$ (where idx-0 is reserved for the value of $v_{o n e} = 1$ )
- $P$ 的 $n - m$ 项： $L_{p} (x) = l_{m + 1} (x) + \dots + l_{n} (x)$
- … 对 $R_{p} (x)$ 和 $O_{p} (x)$ 也做同样的计算
设置 proving key： $({g^{s^{k}}}_{k \in [d]}, {g_{l}^{l_{i} (s)}, g_{r}^{r_{i} (s)}, g_{o}^{o_{i} (s)}, g_{l}^{α_{l} l_{i} (s)}, g_{r}^{α_{r} r_{i} (s)}, g_{o}^{α_{o} o_{i} (s)}, g_{l}^{β l_{i} (s)}, g_{r}^{β r_{i} (s)}, g_{o}^{β o_{i} (s)}}_{i \in {m + 1, \dots, n}})$
添加到 verification key： $(\dots\dots ， {g_{l}^{l_{i} (s)}, g_{r}^{r_{i} (s)}, g_{o}^{o_{i} (s)}}_{i \in {0, \dots, m}})$

Proving :

…为 $V$ 的多项式计算 $h (x) = \frac{L ( x ) \cdot R ( x ) - O ( x )}{t ( x )}$ , 其中 $L (x) = L_{v} (x) + L_{p} (x)$ , and similarly for $R (x), O (x)$
Provide the Proof ： $(g_{l}^{L_{p} (s)}, g_{r}^{R_{p} (s)}, g_{o}^{O_{p} (s)}, g_{l}^{α_{l} L_{p} (s)}, g_{r}^{α_{r} R_{p} (s)}, g_{o}^{α_{o} O_{p} (s)}, g^{Z (s)}, g^{h (s)})$ Verification :
为 $V$ 的变量多项式赋值，并加 $1$ (and add to 1) : $g_{l}^{L_{v} (s)} = g_{l}^{l_{0} (s)} \cdot i = 1 \prod m (g_{l}^{l_{i} (s)})^{v_{i}}$ 对 $g_{r}^{R_{v} (s)}$ 和 $g_{o}^{O_{v} (s)}$ 做同样的计算关于为啥要 +1 : 需要一种机制，让 $V$ 能够控制一些变量的值，而不是由 $P$ 控制, 通过同态加密, 让v_one 就是一个始终为 1 的特殊变量 (先感性理解下吧 …)
变量多项式约束检查： $e (g_{l}^{L_{p}}, g^{α_{l}}) = e (g_{l}^{L_{p}^{'}}, g)$ 对 $g_{r}^{R_{p}}$ 和 $g_{o}^{O_{v} (s)}$ 做同样的计算

变量值一致性检查： $e (g_{l}^{L_{p}} g_{r}^{R_{p}} g_{o}^{O_{p}}, g^{β γ}) = e (g^{Z}, g^{γ}) e (g_{l}^{L_{p}}, g^{β γ}) \cdot e (g_{r}^{R_{p}}, g^{β γ}) \cdot e (g_{o}^{O_{p}}, g^{β γ}) = e (g^{Z}, g^{γ}) \leftarrow 双线性性 e (g_{l}, g)^{L_{p} \times β γ} \cdot e (g_{r}, g)^{R_{p} \times β γ} \cdot e (g_{o}, g)^{O_{p} \times β γ} = e (g^{Z}, g^{γ}) e (g, g)^{β γ \cdot (L_{p} + R_{p} + O_{p})} = e (g^{Z}, g^{γ}) \leftarrow 考虑如何规约到这种形式 ∵ g_{l} = g^{ρ_{l}}, g_{r} = g^{ρ_{r}}, g_{o} = g^{ρ_{o}} e (g^{ρ_{l}}, g)^{L_{p} \times β γ} \cdot e (g^{ρ_{r}}, g)^{R_{p} \times β γ} \cdot e (g^{ρ_{o}}, g)^{O_{p} \times β γ} = e (g, g)^{ρ_{l} \cdot L_{p} \cdot β γ} \cdot e (g, g)^{ρ_{r} \cdot R_{p} \cdot β γ} \cdot e (g, g)^{ρ_{o} \cdot O_{p} \cdot β γ} = e (g, g)^{β γ \cdot (ρ_{l} \cdot L_{p} + ρ_{r} \cdot R_{p} + ρ_{o} \cdot O_{p})} = e (g^{Z}, g^{γ}) \leftarrow 可能是这样 ? 不知道对不对 ∵ g^{Z (s)} = \prod_{i = 1}^{n} (g_{l}^{β l_{i} (s)} \cdot g_{r}^{β r_{i} (s)} \cdot g_{o}^{β o_{i} (s)})^{v_{i}} \leftarrow 可能是这样 ? 不知道对不对 \dots 协议的变量值一致性得到检查$

有效计算检查： $e (g_{l}^{L_{v} (s)} g_{l}^{L_{p}}, g_{r}^{R_{v} (s)} g_{r}^{R_{p}}) = e (g_{o}^{t}, g^{h}) e (g_{o}^{O_{v} (s)} g_{o}^{O_{p}}, g)$

注意：根据协议（单个变量操作数多项式 的章节）的性质，由多项式 $l_{0} (x), r_{0} (x), o_{0} (x)$ 表示的值 $1$ 已在相应的运算中具备了合适的值，因此不需要再赋值了

注意： $V$ 将不得不在验证步骤中做额外的工作，使得赋值的变量成比例。

这实际上是把一些变量从 $P$ 手中拿到 $V$ 的手中，并同时保持等式相等。 因而只有当 $P$ 和 $V$ 的输入中使用相同值的时候， 有效计算检查 才依然成立。

1 这个值相当重要，它能够通过与任意一个常数项相乘来生成这个值（从选择的有限域上），例如，用 123 去乘以 a： $1 \cdot a \times 123 \cdot v_{o n e} = 1 \cdot r$

even@安比实验室: 这里将原本由 $P$ 赋值的一些变量改为由拿到 $V$ 赋值，使得 $P$ 不得不与 $V$ 保持相同的输入。这不仅解决了 $V$ 参数输入的问题，也间接解决了常数赋值的问题

Zero-Knowledge Computation

Zero-Knowledge Proof of Computation

(计算的零知识证明) 自从引入通用计算协议（计算的证明这一章节），我们一直放弃了 零知识 的性质，这是为了让协议的改进变得更简单。至此，我们已经构建了可验证的计算协议。

以前我们使用随机数 δ-转换来构造多项式的“零知识” 证明，这种方法能够使得证明与随机数无法区分（零知识这一章节）： $δ p (s) = t (s) \cdot δ h (s)$ 通过计算我们证明了： $L (s) \cdot R (s) - O (s) = p (s) h (s)$ 尽管我们可以通过用相同 δ × 多项式的方法来调整解决方案，即提供随机值 $δ L (s), δ R (s), δ^{2} O (s), δ^{2} h (s)$ ，这依然能够通过 有效计算检查 来满足配对验证： $e (g, g)^{δ^{2} L (s) R (s)} = e (g, g)^{δ^{2} (t (s) h (s) + O (s))}$ 但是问题是使用相同的 $δ$ 会妨碍安全性，因为我们在证明中分别用了以下这些值：

其他人可以很容易得辨认出两个不同的多项式值是否相同，以此来获取一些知识，即： $g^{δ L (s)} = g^{δ R (s)}$
$L (s)$ 和 $R (s)$ 的不同值之间潜在的微小关系可能会通过暴力破解来区分开来，例如如果 $L (s) = 5 R (s)$ ，就可以对 $i \in {1, \dots, n}$ 取值反复校验 $g^{L (s)} = (g^{R (s)})^{i}$ ，只需要执行 5 步就可以揭示出两者 5 倍区别的关系。同样的暴力破解也可以用在破解加密值的加法运算上，如： $g^{L (s)} = g^{R (s) + 5}$
证明元素之间的其它关系也可能会被发现，例如，如果 $e (g^{δ L (s)}, g^{δ R (s)}) = e (g^{δ^{2} O (s)}, g)$ ，那么也就表示 $L (x) \cdot R (x) = O (x)$

注意：一致性检查优化 使得挖掘数据关系变得更加困难了，但是依然能够发现一些关系，且不说 $V$ 可以选择特定 $ρ_{l}, ρ_{r}$ 来为揭示知识提供便利（只要这不是一个多样化的 $S e t u p$ ）

最终，我们需要对每一个多项式的值使用不同的随机数 $δ_{s}$ ，例如： $δ_{l} L (s) \cdot δ_{r} R (s) - δ_{o} O (s) = t (s) \cdot (Δ (?) h (s))$ 为了解决等式右边不相等的问题，我们不必改变协议，只要修改证明的值 $h (s)$ 即可。这里 Delta ( $Δ$ ) 代表为了平衡方程另一侧的随机性而对 $h (s)$ 做的处理，?⃝ 代表 乘法运算或者 加法运算（这个反过来也适应了除法和减法）。

如果我们选择用乘法 (?⃝ = ×) 来计算 $Δ$ ，也就意味着不太可能有较大的概率可以找到一个 $Δ$ ，因为存在随机性： $Δ = \frac{δ _{l} L ( s ) \cdot δ _{r} R ( s ) - δ _{o} O ( s )}{t ( s ) h ( s )}$ 设置 $δ_{o} = δ_{l} \cdot δ_{r}$ ，于是就变成了： $Δ = \frac{δ _{l} δ _{r} ( L ( s ) \cdot R ( s ) - O ( s ))}{t ( s ) h ( s )} = δ_{l} δ_{r}$ 但是如前文所述，这个妨碍了零知识的性质，更重要的是这个结构也不再适合 verifier 的输入多项式，因为它们必须是 $δs$ 相应的倍数，这就需要额外的交互了

我们可以尝试把随机数加到变量上： $(L (s) + δ_{l}) \cdot (R (s) + δ_{r}) - (O (s) + δ_{o}) = t (s) \cdot (Δ \times h (s))$ $Δ = \frac{L ( s ) R ( s ) - O ( s ) t ( s ) h ( x ) + δ _{r} L ( s ) + δ _{l} R ( s ) + δ _{l} δ _{r} - δ _{o}}{t ( s ) h ( s )} = 1 + \frac{δ _{r} L ( s ) + δ _{l} R ( s ) + δ _{l} δ _{r} - δ _{o}}{t ( s ) h ( s )}$

但是随机数是不可除尽的。尽管我们可以用 $t (s) h (s)$ 去乘以每一个 $δ$ ，但由于我们已经用了 $Δ$ 乘以 $h (s)$ ， $Δ$ 是组成加密结果的一部分（即 $E (L (s))$ 相等），因此在没有使用配对（它的结果在另一个数值空间内）的情况下是不能计算出 $g^{Δ h (s)}$ 的。同样也不能使用 $s$ 的幂（from $1$ to $d$ ）的加密值对 $Δ h (s)$ 进行加密计算， $Δ h (s)$ 的阶将达到 $2^{d}$ 并且，基于上述同样的原因也无法计算这个随机操作数多项式的值： $g^{L (s) + δ_{l} t (s) h (s)}$ 于是我们应该用加法(?⃝ = +)来使用 $Δ$ ，因为它可以同态地计算。 $(L (s) + δ_{l}) \cdot (R (s) + δ_{r}) - (O (s) + δ_{o}) = t (s) \cdot (Δ + h (s)) Δ = \frac{L ( s ) R ( s ) - O ( s ) + δ _{r} L ( s ) + δ _{l} R ( s ) + δ _{l} δ _{r} - δ _{o} - t ( s ) h ( s )}{t ( s )} => Δ = \frac{δ _{r} L ( s ) + δ _{l} R ( s ) + δ _{l} δ _{r} - δ _{o}}{t ( s )}$

分子中的每一项都是 $δ$ 的倍数，因而我们可以将其与 $t (s)$ 相乘使它可以被分母整除： $(L (s) + δ_{l} t (s)) \cdot (R (s) + δ_{r} t (s)) - (O (s) + δ_{o} t (s)) = t (s) \cdot (Δ + h (s)) L (s) R (s) - O (s) + t (s) (δ_{r} L (s) + δ_{l} R (s) + δ_{l} δ_{r} t (s) - δ_{o}) = t (s) Δ + t (s) h (s) Δ = δ_{r} L (s) + δ_{l} R (s) + δ_{l} δ_{r} t (s) - δ_{o}$

这样就可以在加密的空间中进行“有效计算检查”了： $g^{L (s) + δ_{l} t (s)} = g^{L (s)} \cdot (g^{t (s)})^{δ_{l}} . e t c g^{Δ} = (g^{L (s)})^{δ_{r}} \cdot (g^{R (s)})^{δ_{l}} \cdot (g^{t (s)})^{δ_{l} δ_{r}} g^{- δ_{o}}$ 于是既隐藏了加密值，又使得等式可以通过 有效计算 的检查 $L \cdot R - O + t (δ_{r} L + δ_{l} R + δ_{l} δ_{r} t - δ_{o}) = t (s) h + t (s) (δ_{r} L + δ_{l} R + δ_{l} δ_{r} t - δ_{o})$ 这个结构就是统计学上的零知识 因为增加了 $δ_{l}, δ_{r}, δ_{o}$ 的均匀随机倍数（参见 [Gen+12] 中的定理 13）

注意：这种方法和 $V$ 的操作数也是一致的，即： $g_{l}^{L_{p} + δ_{l} t} \cdot g_{l}^{L_{v}} = g^{L_{p} + L_{v} + δ_{l} t}$

因而当且仅当 $P$ 使用了 $V$ 的值来构造证明(即， $Δ = δ_{r} (L_{p} + L_{v}) + δ_{l} (R_{p} + R_{v}) + δ_{l} δ_{r} t - δ_{o})$ ，这个有效计算的检查依然是成立的，更多的细节看下一部分

为了使得 “变量多项式限制” 和 “变量值一致性”检查与 零知识 的修改一致，就有必要去增加以下的参数到 proving key 中： $g_{l}^{t (s)}, g_{r}^{t (s)}, g_{o}^{t (s)}, g_{l}^{α_{l} t (s)}, g_{r}^{α_{r} t (s)}, g_{o}^{α_{o} t (s)}, g_{l}^{βt (s)}, g_{r}^{βt (s)}, g_{o}^{βt (s)}$ 非常奇怪的是最初的 Pinocchio 协议[Par+13]主要关注可验证的计算，而较少涉及 零知识 性质，这其实只需要一点点小修改，这个几乎是没有什么成本的。

even@安比实验室: 与前文中的零知方案不同，这里通过相加而不是相乘的方式来确保 prover 知识的零知性。

Pinocchio 协议是针对 GGPR 论文的改进，在3.1节中也提到了实现零知识只需要沿用 GGPR 论文的方法即可，并不是这篇论文的贡献。另外，Pinocchio 协议论文侧重工程实践，在2013年时，零知识证明还并没有得到应用。真正的应用还是自从 ZCash 起始

zk-SNARK 协议

在这一步步的改进之后，我们得到了最终版本的 zkSNARK，又名 Pinocchio [Par + 13]，协议（zero knowledge is Optional, 并用紫色标注出来了），就是：

Setup

选择生成元 $g$ 和加密配对 $e$
将变量总数为 $n$ , 其中输入/输出变量数位 $m$ 的函数 $f (u) = y$ ，转换为阶数为 $d$ 大小为 $n + 1$ 的多项式形式（QAP） ${l_{i} (x), r_{i} (x), o_{i} (x)}_{i \in {0, \dots\dots, n}}, t (x)$
选择随机数 $s, ρ_{l}, ρ_{r}, α_{l}, α_{r}, α_{o}, β, γ$
设置 $ρ_{o} = ρ_{l} \cdot ρ_{r}$ 和操作数生成元 $g_{l} = g^{ρ_{l}}, g_{r} = g^{ρ_{r}}, g_{o} = g^{ρ_{o}}$
设置 proving key： $({g^{s^{k}}}_{k \in [d]}, {g_{l}^{l_{i} (s)}, g_{r}^{r_{i} (s)}, g_{o}^{o_{i} (s)}}_{i \in 0, \dots, n}), {g_{l}^{α_{l} l_{i} (s)}, g_{r}^{α_{r} r_{i} (s)}, g_{o}^{α_{o} o_{i} (s)}, g_{l}^{β l_{i} (s)}, g_{r}^{β r_{i} (s)}, g_{o}^{β o_{i} (s)}}_{i \in {m + 1, \dots, n}}, g_{l}^{t (s)}, g_{r}^{t (s)}, g_{o}^{t (s)}, g_{l}^{α_{l} t (s)}, g_{r}^{α_{r} t (s)}, g_{o}^{α_{o} t (s)}, g_{l}^{βt (s)}, g_{r}^{βt (s)}, g_{o}^{βt (s)})$
设置 verfication key： $(g^{1}, g_{o}^{t (s)}, {g_{l}^{l_{i} (s)}, g_{r}^{r_{i} (s)}, g_{o}^{o_{i} (s)}}_{i \in {0, \dots, m}}, g^{α_{l}}, g^{α_{r}}, g^{α_{o}}, g^{γ}, g^{β γ})$

Proving

代入输入值 $u$ ，执行 $f (u)$ 计算获取所有的中间变量值 ${v_{i}}_{i \in {m + 1, \dots, n}}$
把所有未加密的变量多项式赋值给 $L (x) = l_{0} (x) + \sum_{i = 1}^{n} v_{i} \cdot l_{i} (x)$ ，并对 $R (x)$ 和 $O (x)$ 做同样的计算
选择随机数 $δ_{l}, δ_{r} 和 δ_{o}$
计算 $h (x) = \frac{L ( x ) R ( x ) - O ( x )}{t ( x )} + δ_{r} L (x) + δ_{l} R (x) + δ_{l} δ_{r} t (x) - δ_{o}$
将 prover 的变量值赋值给加密的可变多项式 $并进行零知识的 δ - 转换 g_{l}^{L_{p} (s)} = (g_{l}^{t (s)})^{δ_{l}} \cdot i = m + 1 \prod n (g_{l}^{l_{i} (s)})^{v_{i}}$
再用同样的方式计算 $g_{r}^{R_{p}^{'} (s)}$ 和 $g_{o}^{O_{p}^{'} (s)}$
为变量值一致性多项式赋值 : $g^{Z (s)} = (g_{l}^{β t (s)})^{δ_{l}} (g_{r}^{β t (s)})^{δ_{r}} (g_{o}^{β t (s)})^{δ_{o}} \cdot i = m + 1 \prod n (g_{l}^{β l_{i} (s)} g_{r}^{β r_{i} (s)} g_{o}^{β o_{i} (s)})^{v_{i}}$
计算证明 $(g_{l}^{L_{p} (s)}, g_{r}^{R_{p} (s)}, g_{o}^{O_{p} (s)}, g^{h (s)}, g_{l}^{L_{p}^{'} (s)}, g_{r}^{R_{p}^{'} (s)}, g_{o}^{O_{p}^{'} (s)}, g^{Z})$

Verification

解析提供的证明为 $(g_{l}^{L_{p}}, g_{r}^{R_{p}}, g_{o}^{O_{p}}, g^{h}, g_{l}^{L_{p}^{'}}, g_{r}^{R_{p}^{'}}, g_{o}^{O_{p}^{'}}, g^{Z})$
将 输入/输出 赋值给 verifier 的加密多项式并加 1 ： $g_{l}^{L_{v} (s)} = g_{l}^{l_{o} (s)} \cdot i = 1 \prod m (g_{l}^{l_{i} (s)})^{v_{i}}$ 并对 $g_{r}^{R_{v} (s)}$ 和 $g_{o}^{O_{p}}$ 做同样的计算
可变多项式约束检查： $e (g_{l}^{L_{p}}, g^{α_{l}}) = e (g_{l}^{L_{p}^{'}}, g)$ 并对 $g_{r}^{R_{p}}$ 和 $g_{o}^{O_{p}}$ 做同样的检查
变量值一致性检查： $e (g_{l}^{L_{p}}, g^{α_{l}}) = e (g_{l}^{L_{p}^{'}}, g)$
有效的计算检查： $e (g_{l}^{L_{p}} g_{l}^{L_{v} (s)}, g_{r}^{R_{p}} g_{r}^{R_{v} (s)}) = e (g_{o}^{t (s)}, g^{h}) \cdot e (g_{o}^{O_{p}} g_{o}^{O_{v} (s)}, g)$

结论

我们最终完成了一个允许证明计算的有效协议：

简明 (Succinctly) —— 独立于计算量，证明是恒定的，小尺寸的
非交互性 (Non-interactive) —— 证明只要一经计算就可以在不直接与 prover 交互的前提下使任意数量的 verifier 确信
可论证的知识 (with Argument of Knowledge) —— 对于陈述是正确的这点有不可忽略的概率，即无法构造假证据；并且 prover 知道正确陈述的对应值（即：证据），例如，如果陈述是 “B 是 sha256(a) 的结果” 那么就说明 prover 知道一些值 a 能够使得 B = sha256(a) 成立，因为 B 只能够通过 a 的知识计算出来，换句话说就是无法通过 B 来反算出 a（假定 a 的熵足够）。
陈述有不可忽略的概率是正确的 (even@安比实验室: 这里指 Soundness 可靠性)，即，构造假证据是不可行的
零知识 ( zero-knowledge) —— 很“难”从证明中提取任何知识，即，它与随机数无法区分。

even@安比实验室: 所谓 Argument——论证，区别于 Proof —— 证明。 Pinocchio 协议是 Argument 而非 Proof。这是因为 Pinocchio 的可靠性是 Computational Soundness，Statistical ZK，这一类的证明系统被称为 Argument。所谓的 Computational Soundness 暗含了这样的事实：如果 Prover 计算能力足够强大的话，可以破坏可靠性。

基于多项式的特殊性质，模运算，同态加密，椭圆曲线密码学，加密配对和发明者的聪明才智才使得这个协议得以实现。

这个协议证明了一个特殊有限执行机制的计算，即在一次运算中可以将几乎任意数量的变量加在一起但是只能执行一次乘法，因而就有机会优化程序以有效地利用这种特性的同时也使用这个结构最大限度地减少计算次数。

为了验证一个证明， verifier 并不需要知道所有的秘密数据，这一点很关键，这就使得任何人都可以以非交互式方式发布和使用正确构造的 verification key。这一点与只能让一个参与者确信证明的“指定 verifier”方案相反，因而它的信任是不可转移的。在 zkSNARK 中，如果不可信或由单方生成密钥对，则可以实现这个属性。

零知识证明构造领域正在不断发展，包括引入了优化（[BCTV13, Gro16, GM17]），改进例如可更新的 proving key 和 verification key（[Gro+18]），以及新的构造方法（Bulletproofs [Bün+17], ZK-STARK [Ben+18], Sonic [Mal+19]）

PLONK 系列作者：郭宇@Secbit: Founder of Secbit, https://github.com/sec-bit , https://secbit.io/

原链接：https://github.com/sec-bit/learning-zkp/tree/develop/plonk-intro-cn

理解 PLONK（一）：Plonkish Arithmetization

算术化是指把计算转换成数学对象，然后进行零知识证明。 Plonkish 算术化是 Plonk 证明系统特有的算术化方法，在 Plonkish 出现之前，主流的电路表达形式为 R1CS，被 Pinocchio，Groth16，Bulletproofs 等广泛采用。2019 年 Plonk 方案提出了一种看似复古的电路编码方式，但由于 Plonk 方案将多项式的编码应用到了极致，它不再局限于算术电路中的「加法门」和「乘法门」，而是可以支持更灵活的「自定义门」与「查表门」。

我们先回顾一下 R1CS 的电路编码，也是相关介绍最多的算术化方案。然后我们对比引入 Plonkish 编码。

算术电路与 R1CS 算术化

一个算术电路包含若干个乘法门与加法门。每一个门都有「两个输入」引脚和一个「输出」引脚，任何一个输出引脚可以被接驳到多个门的输入引脚上。

先看一个非常简单的算术电路：

这个电路表示了这样的一个计算：

$(x_{1} + x_{2}) \cdot (2 \cdot x_{3}) = o u t$

电路中有4个变量，其中三个变量为输入变量 $(x_{1}, x_{2}, x_{3})$ ，一个输出变量 $o u t$ ，其中还有一个输入为常数，其值为 $2$ 。

一个电路有两种状态：「空白态」和「运算态」。当输入变量没有具体值的时候，电路处于「空白态」，这时我们只能描述电路引线之间的关系，即电路的结构拓扑。

接下来的问题是，我们要先编码电路的「空白态」，即编码各个门的位置，和他们之间引线连接关系。

R1CS 是通过图中的乘法门为中心，用三个「选择子」矩阵来「选择」乘法门的「左输入」、「右输入」、「输出」都分别连接了那些变量。

我们先看看图中最上面的乘法门的左输入，可以用下面的表格来描述：

$10 x_{1} 1 x_{2} 1 x_{3} 0 o u t 0$

这个表格只有一行，因此我们可以用一个向量 $U = (0, 1, 1, 0, 0)$ 来代替，表示乘法门的左输入连接了两个变量， $x_{1}$ 和 $x_{2}$ 。记住，所有的加法门都会被展开成多个变量的相加（或线性组合）。

再看看其右输入，连接了一个变量 $x_{3}$ 和一个常数值，等价于连接了 $x_{3}$ 的两倍，那么右输入的选择子矩阵可以记为

$10 x_{1} 0 x_{2} 0 x_{3} 2 o u t 0$

这里同样可以用一个行向量 $V = (0, 0, 0, 2, 0)$ 来表示，其中的 $2$ 即为上图中电路的常数引线。

最后乘法门的输出按照上面的方法可以描述为 $W = (0, 0, 0, 0, 1)$ ，即输出变量为 $o u t$ ：

$10 x_{1} 0 x_{2} 0 x_{3} 0 o u t 1$

有了三个向量 $(U, V, W)$ ，我们可以通过一个「内积」等式来约束电路的运算：

$(U \cdot (1, x_{1}, x_{2}, x_{3}, o u t)) \cdot (V \cdot (1, x_{1}, x_{2}, x_{3}, o u t)) = (W \cdot (1, x_{1}, x_{2}, x_{3}, o u t))$

这个等式化简之后正好可以得到：

$(x_{1} + x 2) \cdot (2 \cdot x_{3}) = o u t$

如果我们把这几个变量换成赋值向量 $(1, x_{1}, x_{2}, x_{3}, o u t) = (1, 3, 4, 5, 70)$ ，那么电路的运算可以通过「内积」等式来验证：

$(U \cdot (1, 3, 4, 5, 70)) \cdot (U \cdot (1, 3, 4, 5, 70)) = W \cdot (1, 3, 4, 5, 70)$

而一个错误的赋值向量，比如 $(1, 3, 4, 0, 70)$ ，则不满足「内积等式」：

$(U \cdot (1, 3, 4, 0, 70)) \cdot (U \cdot (1, 3, 4, 0, 70)) \neq = W \cdot (1, 3, 4, 0, 70)$

左边运算结果为 $0$ ，右边运算结果为 $70$ 。当然，我们可以验证 $(1, 3, 4, 0, 0)$ 也是一组合法（满足电路约束）的赋值。

并不是任何一个电路都存在赋值向量。凡是存在合法的赋值向量的电路，被称为可被满足的电路。判断一个电路是否可被满足，是一个 NP-Complete 问题，也是一个 NP 困难问题。

这里例子中的两个乘法门并不相同，上面的乘法门是左右输入中都含有变量，而下面的乘法门只有一边的输入为变量，另一边为常数。对于后者这类「常数乘法门」，后续我们也把他们看作为特殊的「加法门」，如下图所示，左边电路右下的乘法门等价于右边电路的右下加法门。

那么如果一个电路含有两个以上的乘法门，我们就不能用 $U, V, W$ 三个向量之间的内积关系来表示运算，而需要构造「三个矩阵」的运算关系。

多个乘法门

比如下图所示电路，有两个乘法门，他们的左右输入都涉及到变量。

这个电路表示了这样的一个计算：

$(x_{1} + x 2) \cdot (x 3 \cdot x 4) = o u t$

我们以乘法门为基准，对电路进行编码。第一步将电路中的乘法门依次编号（无所谓编码顺序，只要前后保持一致）。图中的两个乘法门编码为 #1 与 #2。

然后我们需要为每一个乘法门的中间值引线也给出变量名：比如四个输入变量被记为 $x_{1}, x_{2}, x_{3}, x_{4}$ ，其中 $x_{5}$ 为第二个乘法门的输出，同时作为第一个乘法门的右输入。而 $o u t$ 为第一个乘法门的输出。于是我们可以得到一个关于变量名的向量：

$(x_{1}, x_{2}, x_{3}, x_{4}, x_{5}, o u t)$

该电路的「空白态」可以用下面的三个矩阵来编码：

$U, V, W \in F^{n \times m}$

其中 $n$ 为乘法门的数量，而 $m$ 大致为引线的数量。每一个矩阵的第 $i$ 行「选择」了第 $i$ 个乘法门的输入输出变量。比如我们定义电路的左输入矩阵 $U$ ：

$x_{1} 10 x_{2} 10 x_{3} 01 x_{4} 00 x_{5} 00 o u t 00 i 12$

其中第一个乘法门的左输入为 $(x_{1} + x_{2})$ ，第二个乘法门的左输入为 $x_{3}$ 。右输入矩阵 $V$ 定义为：

$x_{1} 00 x_{2} 00 x_{3} 00 x_{4} 01 x_{5} 10 o u t 00 i 12$

其中1号门的右输入为 $x_{5}$ ，第二个乘法门的右输入为 $x_{4}$ 。最后定义输出矩阵 $W$ ：

$x_{1} 00 x_{2} 00 x_{3} 00 x_{4} 00 x_{5} 01 o u t 10 i 12$

我们把所有的引线赋值看作为一个向量： $a$ （这里用字母 $a$ ，取自 Assignments 首字母）

在上面的例子中，「赋值向量」为

$a = (x_{1}, x_{2}, x_{3}, x_{4}, x_{5}, o u t)$

于是我们可以轻易地检验下面的等式

$(U \cdot a) \circ (V \cdot a) = (W \cdot a)$

其中符号 $\circ$ 为 Hadamard Product，表示「按位乘法」。展开上面的按位乘法等式，我们可以得到这个电路的运算过程：

$[x_{1} + x_{2} x_{3}] \circ [x_{5} x_{4}] = [o u t x_{5}]$

请注意，通常「赋值向量」中需要一个固定赋值为 $1$ 的变量，这是为了处理加法门中的常量输入。

优缺点

由于 R1CS 编码以乘法门为中心，于是电路中的加法门并不会增加 $U, V, W$ 矩阵的行数，因而对 Prover 的性能影响不大。R1CS 电路的编码清晰简单，利于在其上构造各种 SNARK 方案。

在 2019 年 Plonk 论文中的编码方案同时需要编码加法门与乘法门，看起来因此会增加约束的数量，降低 Proving 性能。但 Plonk 团队随后陆续引入了除乘法与加法外的运算门，比如实现范围检查的门，实现异或运算的门等等。不仅如此，Plonk 支持任何其输入输出满足多项式关系的门，即 Custom Gate，还有适用于实现 RAM 的状态转换门等，随着查表门的提出，Plonk 方案逐步成为许多应用的首选方案，其编码方式也有了一个专门的名词：Plonkish。

Plonkish 算术门

回看下例子电路，我们把三个门全都编号， $1, 2, 3$ ，同时把加法门的输出值也标记为变量 $x_{6}$ 。

显然，上面的电路满足三个约束：

$x_{1} + x_{2} = x_{6}$
$x_{3} \cdot x_{4} = x_{5}$
$x_{6} \cdot x_{5} = o u t$

我们定义一个矩阵 $W \in F^{n \times 3}$ 来表示约束（ $n$ 为算术门的数量）：

$i 123 w_{a} x_{6} x_{1} x_{3} w_{b} x_{5} x_{2} x_{4} w_{c} o u t x_{6} x_{5}$

为了区分加法和乘法，我们再定一个向量 $Q \in F^{n \times 5}$ 来表示运算符

$i 123 q_{L} 010 q_{R} 010 q_{M} 101 q_{C} 000 q_{O} 111$

于是我们可以通过下面的等式来表示三个约束：

$q_{L} \circ w_{a} + q_{R} \circ w_{b} + q_{M} \circ (w_{a} \cdot w_{b}) + q_{C} - q_{O} \circ w_{c} = 0$

如果把上面的等式代入并展开，我们可以得到下面的约束等式：

$010 \circ x_{6} x_{1} x_{5} + 010 \circ x_{5} x_{2} x_{4} + 101 \circ x_{6} \cdot x_{5} x_{1} \cdot x_{2} x_{3} \cdot x_{4} = 111 \circ o u t x_{6} x_{5}$

化简后得：

$0 x_{1} 0 + 0 x_{2} 0 + x_{6} \cdot x_{5} 0 x_{3} \cdot x_{4} = o u t x_{6} x_{5}$

这正好是三个算术门的计算约束。

总结下，Plonkish 需要一个矩阵 $Q$ 来描述电路空白态，而所有的赋值则写入了 $W$ 矩阵。对于 Prover 和 Verifier 的交换协议， $W$ 是 Prover 的 witness，属于秘密知识，对 Verifier 保密， $Q$ 矩阵代表了一个实现双方约定共识的电路描述。

不过仅仅有 $Q$ 矩阵是不足以精确描述上面的例子电路。

复制约束

比较下面两个电路，它们的 $Q$ 矩阵完全相同，但它们却完全不同。

两个电路的区别在于 $x_{5}, x_{6}$ 是否被接入了 #1 号门。如果让 Prover 直接把电路赋值填入 $W$ 表格，一个「诚实的」Prover 会在 $w_{a, 1}$ 和 $w_{c, 2}$ 两个位置填上相同的值；而一个「恶意的」Prover 完全可以填上不同的值。如果恶意 Prover 在 $w_{b, 1}$ 和 $w_{c, 3}$ 也填入不同的值，那么实际上 Prover 证明的是上图右边的电路，而非是和 Verifier 共识过的电路（左边)。

$i 123 w_{a} x_{6} x_{1} x_{3} w_{b} \underline{x_{5}} x_{2} x_{4} w_{c} o u t x_{6} \underline{x_{5}}$

我们需要增加新的约束，强制要求右边电路图中 $x_{6} = x_{7}$ 和 $x_{5} = x_{8}$ 。这等价于我们要求 Prover 把同一个变量填入表格多个位置时，必须填入相等的值。

这就需要一类新的约束——「拷贝约束」，即 Copy Constraint。Plonk 采用「置换证明」保证 $W$ 表格中多个位置上的值满足拷贝关系。我们继续用上面这个电路图的案例来说明其基本思路：

设想我们把 $W$ 表格中的所有位置索引排成一个向量：

$σ_{0} = (w_{a, 1}, w_{a, 2}, w_{a, 3}, \underline{w_{b, 1}}, w_{b, 2}, w_{b, 3}, w_{c, 1}, w_{c, 2}, \underline{w_{c, 3}})$

然后把应该相等的两个位置互换，比如上图中要求 $w_{a, 1} = w_{c, 2}$ 和 $w_{b, 1} = w_{c, 3}$ 。于是我们得到了下面的位置向量：

$σ = (w_{c, 2}, w_{a, 2}, w_{a, 3}, \underline{w_{c, 3}}, w_{b, 2}, w_{b, 3}, w_{c, 1}, w_{a, 1}, \underline{w_{b, 1}})$

然后我们要求 Prover 证明： $W$ 表格按照上面的置换之后，仍然等于自身。置换前后的相等性可以保证 Prover 无法作弊。

再来一个例子，当约束一个向量中有三个（或多个）位置上的值必须相同时，只需要把这三个（或多个）位置的值进行循环移位（左移位或者右移位），然后证明移位后的向量与原向量相等即可。比如：

$A = (b_{1}, b_{2}, \underline{a_{1}}, b_{3}, \underline{a_{2}}, b_{4}, \underline{a_{3}})$

如果要证明 $a_{1} = a_{2} = a_{3}$ ，那么只需要证明：

$A^{'} = (b_{1}, b_{2}, \underline{a_{3}}, b_{3}, \underline{a_{1}}, b_{2}, \underline{a_{2}}) = ? A$

在经过置换的向量 $A^{'}$ 中， $a_{1}, a_{2}, a_{3}$ 依次右移交换，即 $a_{1}$ 放到了原来 $a_{2}$ 的位置，而 $a_{2}$ 放到了 $a_{3}$ 的位置， $a_{3}$ 则放到了 $a_{1}$ 的位置。

如果 $A^{'} = A$ ，那么 $A^{'}$ 和 $A$ 所有对应位置上的值都应该相等，可得： $a_{1} = a_{3}$ ， $a_{2} = a_{1}$ ， $a_{3} = a_{2}$ ，即 $a_{1} = a_{2} = a_{3}$ 。这个方法可以适用于任意数量的等价关系。（后续证明两个向量相等的方法请见下章）

那么如何描述电路赋值表格中的交换呢？我们只需要记录 $σ$ 向量即可，当然 $σ$ 向量也可以写成表格的形式：

$i 123 σ_{a} w_{c, 2} w_{a, 2} w_{a, 3} σ_{b} \underline{w_{c, 3}} w_{b, 2} w_{b, 3} σ_{c} w_{c, 1} w_{a, 1} \underline{w_{b, 1}}$

加上 $σ$ ，空白电路可以描述为 $(Q, σ)$ ，电路的赋值为 $W$

$Plonkish_{0} ≜ (Q, σ; W)$

再比较

R1CS 的 $(U, V, W)$ 表格的宽度与引线的数量有关，行数跟乘法门数量有关。这个构造相当于把算术电路看成是仅有乘法门构成，但每个门有多个输入引脚（最多为所有引线的数量）。而 Plonkish 则是同等对待加法门与乘法门，并且因为输入引脚只有两个，所以 $W$ 表格的宽度固定，仅有三列（如果要支持高级的计算门，表格可以扩展到更多列）。这一特性是 Plonk 可以利用 Permutation Argument 实现拷贝约束的前提。

…, and thus our linear contraints are just wiring constraints that can be reduced to a permutation check.

按照 Plonk 论文的统计，一般情况下，算术电路中加法门的数量是乘法门的两倍。如果这样看来， $W$ 表格的行数会三倍于 R1CS 的矩阵。但这个让步会带来更多的算术化灵活度。

电路验证协议框架

有了电路空白结构的描述和赋值，我们可以大致描述下 Plonk 的协议框架。

首先 Prover 和 Verifier 会对一个共同的电路进行共识， $(Q, σ)$ 。假设电路的公开输出为 $o u t = 99$ ，而 $(x_{1}, x_{2}, x_{3}, x_{4})$ 为秘密输入。

Prover 填写 $W$ 矩阵（Verifier 不可见）：

$i 1234 w_{a} x_{6} x_{1} x_{3} 0 w_{b} \underline{x_{5}} x_{2} x_{4} 0 w_{c} [o u t] x_{6} \underline{x_{5}} [o u t]$

其中增加的第四行是为了增加一个额外的算术约束： $o u t = 99$ ，把 $o u t$ 值显示地表示在 $Q$ 矩阵中。

相应的那么 Prover 和 Verifier 共识的 $Q$ 矩阵为

$i 1234 q_{L} 0100 q_{R} 0100 q_{M} 1010 q_{C} 00099 q_{O} 1111$

其中第四行约束，保证 $o u t = 99$ ，可以把 $(q_{L} = 0, q_{R} = 0, q_{M} = 0, q_{C} = 99, q_{O} = 1)$ 代入下面的算术约束，可得 $99 - w_{c} = 0$ ，即 $w_{c, 4} = 99$ 。

$q_{L} \circ w_{a} + q_{R} \circ w_{b} + q_{M} \circ (w_{a} \cdot w_{b}) + q_{C} - q_{O} \circ w_{c} = 0$

为了保证第一行的 $w_{c}$ 也必须为 $99$ ，这就需要在 $σ$ 矩阵中添加额外的一条拷贝约束：让 $o u t$ 变量的位置 $(w_{c, 1})$ 与第四行的输出 $w_{c, 4}$ 交换对调：

$i 1234 σ_{a} w_{c, 2} w_{a, 2} w_{a, 3} w_{a, 4} σ_{b} \underline{w_{c, 3}} w_{b, 2} w_{b, 3} w_{b, 4} σ_{c} [w_{c, 4}] w_{a, 1} \underline{w_{b, 1}} [w_{c, 1}]$

如果 Prover 是诚实的，那么对于 $i \in (1, 2, 3, 4)$ ，下面的算术约束等式成立：

$q_{L, i} \circ w_{a, i} + q_{R, i} \circ w_{b, i} + q_{M, i} \circ (w_{a, i} \cdot w_{b, i}) + q_{C, i} - q_{O, i} \circ w_{c, i} = 0$

验证协议的大概思路如下：

协议开始：Prover 如实填写 $W$ 表格，然后把 $W$ 表格的每一列进行编码，并进行多项式编码，并把编码后的结果发送给 Verifier

协议验证阶段：Verifier 与 Prover 通过进一步的交互，验证下面的等式是否成立：

$q_{L} (X) \cdot w_{a} (X) + q_{R} (X) \cdot w_{b} (X) + q_{M} (X) \cdot (w_{a} (X) \cdot w_{b} (X)) + q_{C} (X) - q_{O} (X) \cdot w_{c} (X) = ? 0$

当然这个验证还不够，还要验证 $(σ_{a} (X), σ_{b} (X), σ_{c} (X))$ 与 $(w_{a} (X), w_{b} (X), w_{c} (X))$ 之间的关系。还有，Verifier 如何通过多项式来验证电路的运算，请看后续章节。

参考文献

[BG12] Bayer, Stephanie, and Jens Groth. “Efficient zero-knowledge argument for correctness of a shuffle.” Annual International Conference on the Theory and Applications of Cryptographic Techniques. Springer, Berlin, Heidelberg, 2012.
[GWC19] Ariel Gabizon, Zachary J. Williamson, and Oana Ciobotaru. “Plonk: Permutations over lagrange-bases for oecumenical noninteractive arguments of knowledge.” Cryptology ePrint Archive (2019).

理解 PLONK（二）：多项式编码

在上篇文章里，我们可以把电路的计算的「合法性检查」转换成一组加法/乘法约束。假如总共有 N 个约束，那么Prover 可以通过多项式编码的方式把多个约束压缩成一个约束，让 Verifier 轻松检查。

多项式的概率检查

把多个约束验证合并的神奇能力来自于「多项式随机挑战」。如果有两个多项式 $f (X)$ 和 $g (X)$ 同为两个次数不超过 $d$ 的多项式。那么 Verifier 只需要给出一个随机挑战值 $ζ \in F$ ，计算 $f (ζ)$ 是否等于 $g (ζ)$ 即可大概率得知 $f (X) = g (X)$ ，其中出错的概率 $\leq \frac{d}{∣ F ∣}$ 。只要保证 $F$ 足够大，那么检查出错的概率就可以忽略不计。

这个原理被称为 Schwartz-Zippel 定理。

假如要验证两个向量 $a + b$ 是否等于 $c$ ，为了可以一步挑战验证，我们要先把三个向量编码成多项式。

一种最直接的方案是把向量当作多项式的「系数」进行编码

$a (X) b (X) c (X) = a_{0} + a_{1} X + a_{2} X^{2} + \dots + a_{n - 1} X^{n - 1} = b_{0} + b_{1} X + b_{2} X^{2} + \dots + b_{n - 1} X^{n - 1} = c_{0} + c_{1} X + c_{2} X^{2} + \dots + c_{n - 1} X^{n - 1}$

显然，如果 $a_{i} + b_{i} = c_{i}$ ，那么 $a (X) + b (X) = c (X)$ 。然后我们可以通过挑战一个随机数 $ζ$ 来检验三个多项式在 $X = ζ$ 处的取值，验证：

$a (ζ) + b (ζ) = ? c (ζ)$

如果上式成立，那么 $a + b = c$ 。

Lagrange 插值与 Evaluation Form

假如我们要验证 $a \circ b = ? c$ ，用系数编码的方式就不容易处理了，因为 $a (X) \cdot b (X)$ 会产生很多的交叉项。并且 $a_{i} \cdot b_{i}$ 和 $c_{i}$ 的项并不对应到 $X^{i}$ 的系数，比如 $a_{1} \cdot b_{1}$ 的系数出现在 $X^{2}$ 上，但同时 $X^{2}$ 项的系数组成还有 $a_{0} \cdot b_{2}$ 和 $a_{2} \cdot b_{0}$ 。而 $c_{1}$ 是 $X^{1}$ 的系数。

我们需要另一种多项式编码方案，利用 Lagrange Basis。如果我们要构造多项式 $a (X)$ ，使得它在定义域 $H = (w_{0}, w_{1}, \dots w_{N - 1})$ 上的取值为 $a$ ，即

$a (w_{0}) a (w_{1}) a (w_{N - 1}) = a_{0} = a_{1} ⋮ = a_{N - 1}$

插值需要用到一组插值多项式： ${L_{i} (X)}_{i \in [0, N - 1]}$ ，其中 $L_{i} (w_{i}) = 1$ ，并且 $L_{i} (w_{j}) = 0 (j \neq = i)$ 。然后 $a$ 可以按如下方式编码：

$a (X) = a_{0} \cdot L_{0} (X) + a_{1} \cdot L_{1} (X) + a_{2} \cdot L_{2} (X) + \dots + a_{N - 1} \cdot L_{N - 1} (X)$

可以简单心算一下，当 $X = w_{0}$ 时，等式右边除了第一项之外，其他项都等于零，于是 $a (w_{0}) = a_{0}$ 。看起来 $L_{i} (X)$ 像是一个选择器，这组多项式又被称为 Lagrange Polynomials。

我们用同样的方法来编码 $b (X)$ 和 $c (X)$ ：

$b (X) = b_{0} \cdot L_{0} (X) + b_{1} \cdot L_{1} (X) + b_{2} \cdot L_{2} (X) + \dots + b_{N - 1} \cdot L_{N - 1} (X) c (X) = c_{0} \cdot L_{0} (X) + c_{1} \cdot L_{1} (X) + c_{2} \cdot L_{2} (X) + \dots + c_{N - 1} \cdot L_{N - 1} (X)$

如果 $a_{i} \cdot b_{i} = c_{i}$ 成立，那么 $a (w_{i}) \cdot b (w_{i}) = c (w_{i})$ 。如果 $a \circ b = c$ ，那么

$a (X) \cdot b (X) = c (X), \forall X \in H$

我们现在已经把两个向量的按位乘积问题转换到了三个多项式之间的关系，接下来的问题是如何进行随机挑战验证。

我们发现：如果直接让 Verifier 发送随机数 $ζ$ 挑战上面的等式，那么 $ζ$ 只能属于 $H$ 。如果只存在一个 $j$ 使得 $a_{j} \cdot b_{j} \neq = c_{j}$ ，那么 Verifier 的一次挑战能发现这个错误的概率只有 $\frac{1}{∣ n ∣}$ ，这样 Verifier 需要挑战多次才能缩小检测出错的概率。不过这样不满足我们的要求，我们希望只通过一次挑战来检测出 Prover 的作弊行为。

我们可以把上面的等式的 $X$ 取值范围去除，换成下面的等式：

$a (X) \cdot b (X) - c (X) = q (X) \cdot z_{H} (X), \forall X \in F$

这个等式在整个 $F$ 定义域上都成立。这是为何？

首先我们看等式左边的多项式： $a (X) \cdot b (X) - c (X)$ ，不妨定义为 $f (X)$ 。我们可以看到 $f (X)$ 在 $X \in H$ 上等于零，那么意味着 $H$ 恰好是 $f (X)$ 的「根集合」。于是 $f (X)$ 可以按照下面的方式进行因式分解：

$f (X) = (X - w_{0}) (X - w_{1}) (X - w_{2}) \dots (X - w_{N - 1}) \cdot q (X)$

换个说法， $f (X)$ 可以被多项式 $z_{H} (X) = (X - w_{0}) (X - w_{1}) (X - w_{2}) \dots (X - w_{n - 1})$ 整除，并得到一个商多项式 $q (X)$ 。零多项式 $z_{H} (X)$ 又被称为 Vanishing Polynomial。

如果我们让 Prover 计算出这个 $q (X)$ ，并且发送给 Verifier，又因为 $H$ 是已知的系统参数，Verifier 可以自行计算 $z_{H} (X)$ ，那么 Verifier 只需要一次随机检测即可判断 $a (X) \cdot b (X) - c (X)$ 是否在 $H$ 处等零。

$a (ζ) \cdot b (ζ) - c (ζ) = ? q (ζ) \cdot z_{H} (ζ)$

进一步，如果我们使用多项式承诺（Polynomial Commitment），Verifier 可以让 Prover 来帮忙计算这些多项式在 $X = ζ$ 处的取值，发送并证明这些值的正确性，这样能最大限度地减少 Verifier 的工作量。

但是， Verifier 计算 $z_{H} (ζ)$ 需要 $O (n)$ 的计算量。

那能否让 Verifier 继续减少工作量？答案是可以的，只要我们选择特殊的 $H \subset F$ 。

单位根 Roots of Unity

如果我们选择单位根作为 $H$ ，那么 $z_{H} (ζ)$ 的计算量会降为 $O (lo g n)$ 。

对于任何有限域 $F_{p} = (0, 1, \dots, p - 1)$ ，其中阶数 $p$ 为素数。那么去除零之后剩下的元素构成了乘法群 $F_{p}^{*} = (1, \dots, p - 1)$ ，阶数为 $p - 1$ 。由于 $p - 1$ 一定为偶数，那么 $p - 1$ 的乘法因子中一定包含若干个 $2$ ，假设记为 $λ$ 个 $2$ 。那么 $F_{p}^{*}$ 一定包含一个阶数为 $2^{λ}$ 的乘法子群。不妨设 $n = 2^{k}, k \leq λ$ ，那么一定存在一个阶数为 $n$ 的乘法子群，记为 $H$ 。该乘法子群必然含有一个生成元，记为 $ω$ ，并且 $ω^{N} = 1$ 。这相当于把 $1$ 开 $N$ 次方根，因此被称为单位根。不过单位根不只有一个 $ω$ ，我们会发现 $ω^{2}, ω^{3}, \dots, ω^{N - 1}$ 都满足单位根的特性，即 $(ω^{k})^{N} = 1, k \in (2, 3, \dots, N - 1)$ 。那么所有这些由 $ω$ 产生的单位根就组成了乘法子群 $H$ ：

$H = (1, ω, ω^{2}, ω^{3}, \dots, ω^{N - 1})$

这些元素满足一定的对称性：比如 $ω^{\frac{N}{2}} = - 1$ ， $ω = - ω^{\frac{N}{2} + 1}$ ， $ω^{i} = - ω^{\frac{N}{2} + i}$ 。又比如把所有的单位根求和，我们会得到零：

$i = 0 \sum N - 1 ω^{i} = 0$

举一个简单的例子，我们可以在 $F_{13}$ 中找到一个阶数为 $4$ 的 $H$ 。

$F_{13} = (0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)$

其中乘法群的生成元为 $g = 2$ 。由于 13-1=3*2*2，所以存在一个阶数为 $4$ 的乘法子群，其生成元为 $ω = 5$ ：

$H = (ω^{0} = 1, ω^{1} = 5, ω^{2} = 12, ω^{3} = 8)$

而 $ω^{4} = 1 = ω^{0}$ 。

在实际应用中，我们会选择一个较大的有限域，它能有一个较大的 Powers-of-2 乘法子群。比如椭圆曲线 BN254 的 Scalar Field，含有一个阶数为 $2^{28}$ 的乘法子群，BLS-12-381 的Scalar Field 含有一个阶数为 $2^{32}$ 的乘法子群。

在乘法子群 $H$ 上，具有下面的性质：

$z_{H} (X) = i = 0 \prod N - 1 (X - ω^{i}) = X^{N} - 1$

我们可以进行简单的推导，假设 $N = 4$ ，由于 $ω^{i}$ 的对称性，这个计算过程可以不断化简：

$= = = = = (X - ω^{0}) (X - ω^{1}) (X - ω^{2}) (X - ω^{3}) (X - 1) (X - ω) (X + 1) (X - ω^{3}) (X^{2} - 1) (X - ω) (X + ω) (X^{2} - 1) (X^{2} - ω^{2}) (X^{2} - 1) (X^{2} + 1) (X^{4} - 1)$

Lagrange Basis

对于 Lagrange 多项式， $L_{i} (w_{i}) = 1$ ，并且 $L_{i} (w_{j}) = 0, (j \neq = i)$ 。接下来，我们给出 $L_{i} (X)$ 的构造。

为了构造 $L_{i} (X)$ ，先构造不等于零的多项式部分。由于 $L_{i} (ω_{j}) = 1, j = i$ ，因此他一定包含 $\prod_{j, j \neq = i} (X - ω_{j})$ 这个多项式因子。但该因子显然在 $X = ω_{i}$ 处可能不等于 $1$ ，即可能 $\prod_{j, j \neq = i} (ω_{i} - ω_{j}) \neq = 1$ 。然后，我们只要让该因子除以这个可能不等于 $1$ 的值即可，于是 $L_{i} (X)$ 定义如下：

$L_{i} (X) = \frac{\prod _{j \in H ∖ {i}} ( X - ω _{j} )}{\prod _{j \in H ∖ {i}} ( ω _{i} - ω _{j} )} = j \in H ∖ {i} \prod \frac{X - ω _{j}}{ω _{i} - ω _{j}}$

不难发现， $L_{i} (X)$ 在 $X = ω_{i}$ 处等于 $1$ ，其它位置 $X = ω_{j}, j \neq = i$ 处等于 $0$ 。

对于任意次数小于 $N$ 的多项式 $f (X)$ ，那么它都可以唯一地表示为：

$f (X) = a_{0} \cdot L_{0} (X) + a_{1} \cdot L_{1} (X) + a_{2} \cdot L_{2} (X) + \dots + a_{N - 1} \cdot L_{N - 1} (X)$

我们可以用多项式在 $H$ 上的值 $(a_{0}, a_{1}, a_{2}, \dots, a_{N - 1})$ 来表示 $f (X)$ 。这被称为多项式的求值形式（Evaluation Form），区别于系数形式（Coefficient Form）。

两种形式可以在 $H$ 上可以通过 (Inverse) Fast Fourier Transform 算法来回转换，计算复杂度为 $O (N lo g N)$ 。

多项式的约束

利用 Lagrange Basis 我们可以方便地对各种向量计算进行约束。

比如我们想约束 $a = (h, a_{1}, a_{2}, \dots, a_{N - 1})$ 向量的第一个元素为 $h$ 。那么我们可以对这个向量进行编码，得到 $a (X)$ ，并且进行如下约束：

$L_{0} (X) (a (X) - h) = 0, \forall X \in H$

Verifier 可以挑战验证下面的多项式等式：

$L_{0} (X) (a (X) - h) = q (X) \cdot z_{H} (X)$

再比如，我们想约束 $a = (h_{1}, a_{1}, a_{2}, \dots, a_{N - 2}, h_{2})$ 向量的第一个元素为 $h_{1}$ ，最后一个元素为 $h_{2}$ ，其它元素任意。那么 $a (X)$ 应该满足下面两个约束。

$L_{0} (X) \cdot (a (X) - h_{1}) L_{N - 1} (X) \cdot (a (X) - h_{2}) = 0, \forall X \in H = 0, \forall X \in H$

那么通过 Verifier 给一个随机挑战数（ $α$ ），上面两个约束可以合并为一个多项式约束：

$L_{0} (X) \cdot (a (X) - h_{1}) + α \cdot L_{n - 1} (X) \cdot (a (X) - h_{2}) = 0, \forall X \in H$

接下来，Verifier 只要挑战下面的多项式等式即可：

$L_{0} (X) \cdot (a (X) - h_{1}) + α \cdot L_{n - 1} (X) \cdot (a (X) - h_{2}) = q (X) \cdot z_{H} (X)$

如果想验证 $a$ 和 $b$ 两个等长向量除第一个元素之外，其它元素都相等，那要如何约束呢？假设 $a (X)$ 和 $b (X)$ 为两个向量的多项式编码，那么它们应该满足：

$(X - ω^{0}) (a (X) - b (X)) = 0$

当 $X = ω^{0}$ 时，左边多项式的第一个因子等于零，而 $X \in H ∖ {ω^{0}}$ 时，则左边第二因子等于零，即表达了除第一项可以不等之外，其它点取值都必须相等。

可以看出，采用 Lagrange 多项式，我们可以灵活地约束多个向量之间的关系，并且可以把多个约束合并在一起，让 Verifier 仅通过很少的随机挑战就可验证多个向量约束。

Coset

在素数有限域的乘法群中，对于每一个乘法子群 $H$ ，都有多个等长的陪集（Coset），这些 Coset 具有和 $H$ 类似的性质，在 Plonk 中也会用到 Coset 的概念，这里只做部分性质的介绍。

还拿 $F_{13}$ 为例，我们取 $H = (1, 5, 12, 8)$ ，并且乘法群的生成元 $g = 2$ 。于是我们可以得到下面两个 Coset：

\begin{split} H_1 &= g\cdot H = (g, g\omega, g\omega^2, g\omega^3) &= (2,10,11,3) \ H_2 &= g^2\cdot H = (g^2, g^2\omega, g^2\omega^2, g^2\omega^3) &= (4,7,9,6) \ \end{split}

可以看到 $F_{13}^{*} = H \cup H_{1} \cup H_{2}$ ，并且它们交集为空，没有任何重叠。并且它们的 Vanishing Polynomial 也可以快速计算：

$z_{H_{1}} (X) = X^{N} - g^{N}, z_{H_{2}} (X) = X^{N} - g^{2 N}$

References

Schwartz–Zippel lemma. https://en.wikipedia.org/wiki/Schwartz%E2%80%93Zippel_lemma

理解 PLONK（三）：置换证明

Plonkish 电路编码用两个矩阵 $(Q, σ)$ 描述电路的空白结构，其中 $Q$ 为运算开关， $σ$ 为置换关系，用来约束 $W$ 矩阵中的某些位置必须被填入相等的值。本文重点讲解置换证明（Permutation Argument）的原理。

回顾拷贝关系

回顾一下 Plonkish 的 $W$ 表格，总共有三列，行数按照 $2^{2}$ 对齐。

$i 1234 w_{a, i} x_{6} x_{1} x_{3} 0 w_{b, i} x_{5} x_{2} x_{4} 0 w_{c, i} o u t x_{6} x_{5} o u t$

我们想约束 Prover 在填写 $W$ 表时，满足下面的拷贝关系： $w_{a, 1} = w_{c, 2}$ $w_{b, 1} = w_{c, 3}$ 与 $w_{c, 1} = w_{c, 4}$ ，换句话说， $w_{a, 1}$ 位置上的值需要被拷贝到 $w_{c, 2}$ 处，而 $w_{b, 1}$ 位置上的值需要被拷贝到 $w_{c, 3}$ 处， $w_{c, 1}$ 位置上的值被拷贝到 $w_{c, 4}$ 处。

问题的挑战性在于，Verifier 要仅通过一次随机挑战就能完成 $W$ 表格中多个拷贝关系的证明，并且在看不到 $W$ 表格的情况下。

Plonk 的「拷贝约束」是通过「置换证明」（Permutation Argument）来实现，即把表格中需要约束相等的那些值进行循环换位，然后证明换位后的表格和原来的表格完全相等。

简化一下问题：如何证明两个等长向量 $a$ 和 $a^{'}$ 满足一个已知的置换 $σ$ ，并且 $a = a^{'}$

$a_{i} = a_{σ (i)}^{'}$

举一个例子，假设 $a = (a_{0}, a_{1}, a_{2}, a_{3})$ ， $a^{'} = (a_{1}, a_{2}, a_{3}, a_{0})$ ，即他们满足一个「左移循环换位」的置换关系，那么 $σ = {0 \to 1; 1 \to 2; 2 \to 3; 3 \to 0}$ 。如何能证明 $a = a^{'}$ ，那么两个向量对应位置的值都应该相等，


$a$	$a_{0}$	$a_{1}$	$a_{2}$	$a_{3}$
$a^{'}$	$a_{1}$	$a_{2}$	$a_{3}$	$a_{0}$

那么 $a_{0} = a_{1}$ ， $a_{1} = a_{2}$ ， $a_{2} = a_{3}$ ， $a_{3} = a_{0}$ ，于是可以得出结论： $a_{0} = a_{1} = a_{2} = a_{3}$ ，即 $a$ 中的全部元素都相等。

对于 $W$ ，我们只需要针对那些需要相等的位置进行循环换位，然后让 Prover 证明 $W$ 和经过循环换位后的 $W^{'}$ 表格相等，那么可实现拷贝约束。证明两个表格相等，这个可以通过多项式编码，然后进行概率检验的方式完成。剩下的工作就是如何让 Prover 证明 $W^{'}$ 确实是（诚实地）按照事先约定的方式进行循环移位。

那么接下来就是理解如何让 Prover 证明两个向量之间满足某一个「置换关系」。置换证明（Permutation Argument）是 Plonk 协议中的核心部分，为了解释它的工作原理，我们先从一个基础协议开始——连乘证明（Grand Product Argument）。

冷启动：Grand Product

假设我们要证明下面的「连乘关系」：

$p = q_{0} \cdot q_{1} \cdot q_{2} \cdot \dots \cdot q_{n - 2}$

我们在上一篇文章介绍了如何证明一组「单乘法」，通过多项式编码，把多个单乘法压缩成单次乘法的验证。

这里对付连乘的基本思路是：让 Prover 利用一组单乘的证明来实现多个数的连乘证明，然后再通过多项式的编码，交给 Verifier 进行概率检查。

强调下：思路中的关键点是如何把一个连乘计算转换成多次的单乘计算。

我们需要通过引入一个「辅助向量」，把「连乘」的计算看成是一步步的单乘计算，然后辅助向量表示每次单乘之后的「中间值」：

$q_{i} q_{0} q_{1} q_{2} ⋮ q_{n - 2} r_{i} r_{0} = 1 r_{1} r_{2} ⋮ r_{n - 2} q_{i} \cdot r_{i} r_{1} = q_{0} r_{2} = q_{0} \cdot q_{1} r_{3} = q_{0} \cdot q_{1} \cdot q_{2} ⋮ r_{n - 1} = p$

上面表格表述了连乘过程的计算轨迹（Trace），每一行代表一次单乘，顺序从上往下计算，最后一行计算出最终的结果。

表格的最左列为要进行连乘的向量 ${q_{i}}$ ，中间列 ${r_{i}}$ 为引入的辅助变量，记录每次「单乘之前」的中间值，最右列表示每次「单乘之后」的中间值。

不难发现，「中间列」向量 $r$ 向上挪一行与「最右列」几乎一致，除了最后一个元素。该向量的第一个元素用了常数 $1$ 作为计算初始值，「最右列」最后一个向量元素为计算结果。

向量 $r$ 是一个 Accumulator，即记录连乘计算过程中的每一个中间结果：

$r_{k} = i = 0 \prod k - 1 q_{i}$

那么显然我们可以得到下面的递归式：

$r_{0} = 1, r_{k + 1} = q_{k} \cdot r_{k}$

于是，表格的三列编码后的多项式也将满足下面三个约束。第一个是初始值为 $1$ ：

$L_{0} (X) \cdot (r (X) - 1) = 0, \forall X \in H$

第二个约束为递归的乘法关系：

$q (X) \cdot r (X) = r (ω \cdot X), \forall X \in H ∖ {ω^{- 1}}$

第三个约束最后结果 $r_{n - 1} = p$ ：

$L_{n - 1} (X) \cdot (r (X) - p) = 0, \forall X \in H$

我们可以用一个小技巧来简化上面的三个约束。我们把计算连乘的表格添加一行，令 $q_{n - 1} = 1/ p$ （注意： $p$ 为 $q$ 向量的连乘积）

$q_{i} q_{0} q_{1} q_{2} ⋮ q_{n - 2} q_{n - 1} = \frac{1}{p} r_{i} 1 r_{0} r_{1} ⋮ r_{n - 2} r_{n - 1} q_{i} \cdot r_{i} r_{0} r_{1} r_{2} ⋮ r_{n - 1} 1$

这样一来， $r_{n} = r_{0} = 1$ 。最右列恰好是 $r$ 的循环移位。并且上面表格的每一行都满足「乘法关系」！于是，我们可以用下面的多项式约束来表示递归的连乘：

$q (X) \cdot r (X) = r (ω \cdot X), \forall X \in H$

接下来，Verifier 可以挑战下面的多项式等式：

$L_{0} (X) \cdot (r (X) - 1) + α \cdot (q (X) \cdot r (X) - r (ω \cdot X)) = h (X) \cdot z_{H} (X)$

其中 $α$ 是用来聚合多个多项式约束的随机挑战数。其中 $h (X)$ 为商多项式， $z_{H} (X) = (X - 1) (X - ω) \dots (X - ω^{n - 1})$ 。

接下来，通过 Schwartz-Zippel 定理，Verifier 可以给出挑战数 $ζ$ 来验证上述多项式等式是否成立。

到此为止，如果我们已经理解了如何证明一个向量元素的连乘，那么接下来的问题是如何利用「连乘证明」来实现「Multiset 等价证明」（Multiset Equality Argument）。

从 Grand Product 到 Multiset 等价

假设有两个向量，其中一个向量是另一个向量的乱序重排，那么如何证明它们在集合意义（注意：集合无序）上的等价呢？最直接的做法是依次枚举其中一个向量中的每个元素，并证明该元素属于另一个向量。但这个方法有个限制，就是无法处理向量中会出现两个相同元素的情况，也即不支持「多重集合」（Multiset）的判等。例如 ${1, 1, 2}$ 就属于一个多重集合（Multiset），那么它显然不等于 ${1, 2, 2}$ ，也不等于 ${2, 1}$ 。

另一个直接的想法是将两个向量中的所有元素都连乘起来，然后判断两个向量的连乘值是否相等。但这个方法同样有一个严重的限制，就是向量元素必须都为素数，比如 $3 \cdot 6 = 9 \cdot 2$ ，但 ${3, 6} \neq = {9, 2}$ 。

修改下这个方法，我们假设向量 ${q_{i}}$ 为一个多项式 $q (X)$ 的根集合，即对向量中的任何一个元素 $q_{i}$ ，都满足 $q (r_{i}) = 0$ 。这个多项式可以定义为：

$q (X) = (X - q_{0}) (X - q_{1}) (X - q_{2}) \dots (X - q_{n - 1})$

如果存在另一个多项式 $p (X)$ 等于 $q (X)$ ，那么它们一定具有相同的根集合 ${q_{i}}$ 。比如

$i \prod (X - q_{i}) = q (X) = p (X) = i \prod (X - p_{i})$

那么

${q_{i}} =_{m u lt i se t} {p_{i}}$

我们可以利用 Schwartz-Zippel 定理来进一步地检验：向 Verifier 索要一个随机数 $γ$ ，那么 Prover 就可以通过下面的等式证明两个向量 ${p_{i}}$ 与 ${q_{i}}$ 在多重集合意义上等价：

$i \in [n] \prod (γ - p_{i}) = i \in [n] \prod (γ - q_{i})$

还没结束，我们需要用上一节的连乘证明方案来继续完成验证，即通过构造辅助向量（作为一个累积器），把连乘转换成多个单乘来完成证明。需要注意的是，这里的两个连乘可以合并为一个连乘，即上面的连乘相等可以转换为

$i \in [n] \prod \frac{( γ - p _{i} )}{( γ - q _{i} )} = 1$

到这里，我们已经明白如何证明「Multiset 等价」，下一步我们将完成构造「置换证明」（Permutation Argument），用来实现协议所需的「Copy Constraints」。

从 Multiset 等价到置换证明

Multiset 等价可以被看作是一类特殊的置换证明。即两个向量 $p_{i}$ 和 $q_{i}$ 存在一个「未知」的置换关系。

而我们需要的是一个支持「已知」的特定置换关系的证明和验证。也就是对一个有序的向量进行一个「公开特定的重新排列」。

先简化下问题，假如我们想让 Prover 证明两个向量满足一个奇偶位互换的置换：

$a b = = (a_{0}, a_{1}, a_{2}, a_{3}, \dots, a_{n - 1}, a_{n}) (a_{1}, a_{0}, a_{3}, a_{2}, \dots, a_{n}, a_{n - 1})$

我们仍然采用「多项式编码」的方式把上面两个向量编码为两个多项式， $a (X)$ 与 $b (X)$ 。思考一下，我们可以用下面的「位置向量」来表示「奇偶互换」：

$i = (1, 2, 3, 4, \dots, n - 1, n), σ = (2, 1, 4, 3, \dots, n, n - 1)$

我们进一步把这个位置向量和 $a$ 与 $b$ 并排放在一起：

$a_{i} a_{0} a_{1} a_{2} a_{3} ⋮ a_{n} a_{n - 1} i 0123 ⋮ n n - 1 b_{i} b_{0} = a_{1} b_{1} = a_{0} b_{2} = a_{3} b_{3} = a_{2} ⋮ b_{n} = a_{n - 1} b_{n - 1} = a_{n} σ (i) 1032 ⋮ n - 1 n$

接下来，我们要把上表的左边两列，还有右边两列分别「折叠」在一起。换句话说，我们把 $(a_{i}, i)$ 视为一个元素，把 $(b_{i}, σ (i))$ 视为一个元素，这样上面表格就变成了：

$a_{i}^{'} = (a_{i}, i)$	$b_{i}^{'} = (b_{i}, σ (i))$
$(a_{0}, 0)$	$(b_{0} = a_{1}, 1)$
$(a_{1}, 1)$	$(b_{1} = a_{0}, 0)$
$⋮$	$⋮$
$(a_{n - 1}, n - 1)$	$(b_{n - 1} = a_{n}, n)$
$(a_{n}, n)$	$(b_{n} = a_{n - 1}, n - 1)$

容易看出，如果两个向量 $a$ 与 $b$ 满足 $σ$ 置换，那么，合并后的两个向量 $a^{'}$ 和 $b^{'}$ 将满足 Multiset 等价关系。

也就是说，通过把向量和位置值合并，就能够把一个「置换证明」转换成一个「多重集合等价证明」，即不用再针对某个特定的「置换关系」进行证明。

这里又出现一个问题，表格的左右两列中的元素为二元组（Pair），二元组无法作为一个「一元多项式」的根集合。

我们再使用一个技巧：再向 Verifier 索取一个随机数 $β$ ，把一个元组「折叠」成一个值：

$a_{i}^{'} = (a_{i} + β \cdot i)$	$b_{i}^{'} = (b + β \cdot σ (i))$
$(a_{0} + β \cdot 0)$	$(b_{0} + β \cdot 1)$
$(a_{1} + β \cdot 1)$	$(b_{1} + β \cdot 0)$
$⋮$	$⋮$
$(a_{n - 1} + β \cdot n - 1)$	$(b_{n - 1} + β \cdot n)$
$(a_{n} + β \cdot n)$	$(b_{n} + β \cdot (n - 1))$

接下来，Prover 可以对 $a^{'}$ 与 $b^{'}$ 两个向量进行 Multiset 等价证明，从而可以证明它们的置换关系。

完整的置换协议

公共输入：置换关系 $σ$

秘密输入：两个向量 $a$ 与 $b$

预处理：Prover 和 Verifier 构造 $[i d (X)]$ 与 $[σ (X)]$

第一步：Prover 构造并发送 $[a (X)]$ 与 $[b (X)]$

第二步：Verifier 发送挑战数 $β$ 与 $γ$

第三步：Prover 构造辅助向量 $z$ ，构造多项式 $z (X)$ 并发送 $[z (X)]$

$z_{0} z_{i + 1} = 1 = z_{i} \cdot \frac{a _{i} + β \cdot i + γ}{b _{i} + β \cdot σ ( i ) + γ}$

第四步：Verifier 发送挑战数 $α$

第五步：Prover 构造 $f (X)$ 与 $q (X)$ ，并发送 $[q (X)]$

$f (X) = L_{0} (X) (z (X) - 1) + α \cdot (z (ω \cdot X) (b (X) + β \cdot σ (X) + γ) - z (X) (a (X) + β \cdot i d (X) + γ))$

$q (X) = \frac{f ( X )}{z _{H} ( X )}$

第六步：Verifier 向 $[a (X)], [b (X)], [q (X)]$ 查询这三个多项式在 $X = ζ$ 处的取值，得到 $a (ζ)$ ， $b (ζ)$ ， $q (ζ)$ ；向 $[z (X)]$ 查询 $X = ζ, X = ω \cdot ζ$ 两个位置处的取值，即 $z (ζ), z (ω \cdot ζ)$ ；向 $[σ (X)]$ 与 $[i d (X)]$ 这两个多项式发送求值查询 $X = ζ$ ，得到 $i d (ζ)$ 与 $σ (ζ)$ ；Verifier 自行计算 $z_{H} (ζ)$ ， $L_{0} (ζ)$

验证步：Verifier 验证

$L_{0} (ζ) (z (ζ) - 1) + α \cdot (z (ω \cdot ζ) (b (ζ) + β \cdot σ (ζ) + γ) - z (ζ) (a (ζ) + β \cdot i d (ζ) + γ)) = ? q (ζ) z_{H} (ζ)$

协议完毕。

References:

[WIP] Copy constraint for arbitrary number of wires. https://hackmd.io/CfFCbA0TTJ6X08vHg0-9_g
Alin Tomescu. Feist-Khovratovich technique for computing KZG proofs fast. https://alinush.github.io/2021/06/17/Feist-Khovratovich-technique-for-computing-KZG-proofs-fast.html#fn:FK20
Ariel Gabizon. Multiset checks in PLONK and Plookup. https://hackmd.io/@arielg/ByFgSDA7D

理解 PLONK（四）：算术约束与拷贝约束

回顾置换证明

上一节，我们讨论了如何让 Prover 证明两个长度为 $N$ 的向量 $a$ 与 $b$ 满足一个实现约定（公开）的置换关系 $σ (\cdot)$ ，即

$a_{i} = b_{σ (i)}$

基本思路是向 Verifier 要一个随机数 $β$ ，把两个「原始向量」和他们的「位置向量」进行合体，产生出两个新的向量，记为 $a^{'}$ 与 $b^{'}$

$a_{i}^{'} = a_{i} + β \cdot i, b_{i}^{'} = b_{i} + β \cdot σ (i)$

第二步是再向 Verifier 要一个随机数 $γ$ ，通过连乘的方法来编码 $a^{'}$ 和 $b^{'}$ 的 Multiset，记为 $A$ 和 $B$ ：

$A = \prod (a_{i}^{'} + γ), B = \prod (b_{i}^{'} + γ)$

第三步是让 Prover 证明 $A / B = 1$ ，即

$i \prod \frac{( a _{i}^{'} + γ )}{( b _{i}^{'} + γ )} = 1$

证明这个连乘，需要引入一个辅助向量 $z$ ，记录每次乘法运算的中间结果：

$z_{0} = 1, z_{i + 1} = z_{i} \cdot \frac{( a _{i}^{'} + γ )}{( b _{i}^{'} + γ )}$

由于 $z_{N} = \prod \frac{a _{i}^{'} + γ}{b _{i}^{'} + γ} = 1$ ，而且 $ω^{N} = 1$ ，因此我们可以用 $z (X)$ 来编码 $z$ ，从而把置换证明转换成关于 $z (X), a (X)$ 的关系证明。

最后 Verifier 发送挑战数 $ζ$ ，得到 $z (ζ), z (ω \cdot ζ), a (ζ), b (ζ)$ 然后检查它们之间的关系。

向量的拷贝约束

所谓拷贝约束 Copy Constraints，是说在一个向量中，我们希望能证明多个不同位置上的向量元素相等。我们先从一个简单例子开始：

$a = (a_{0}, a_{1}, a_{2}, a_{3})$

假设为了让 Prover 证明 $a_{0} = a_{2}$ ，我们可以把 $a_{0}$ 与 $a_{2}$ 对调位置，这样形成一个「置换关系」，如果我们用 $(0, 1, 2, 3)$ 记录被置换向量的元素位置，那么我们把置换后的位置向量记为 $σ$ ，而 $a_{σ}$ 为表示按照 $σ$ 置换后的向量

$σ = (2, 1, 0, 3), a_{σ} = (a_{2}, a_{1}, a_{0}, a_{3})$

显然，只要 Prover 可以证明置换前后的两个向量相等， $a = a_{σ}$ ，那么我们就可以得出结论： $a_{0} = a_{2}$ 。

这个方法可以推广到证明一个向量中有多个元素相等。比如要证明 $a$ 中的前三个元素都相等，我们只需要构造一个置换，即针对这三个元素的循环右移：

$σ = (2, 0, 1, 3), a_{σ} = (a_{2}, a_{0}, a_{1}, a_{3})$

那么根据 $a = a_{σ}$ 容易得出 $a_{0} = a_{1} = a_{2}$ 。

多个向量间的拷贝约束

对于 Plonk 协议，拷贝约束需要横跨 $W$ 表格的所有列，而协议要求 Prover 要针对每一列向量进行多项式编码。我们需要对置换证明进行扩展，从而支持横跨多个向量的元素等价。

回忆比如针对上面电路的 $W$ 表格：

$i 0123 w_{a} 0 x_{6} x_{1} x_{3} w_{b} 0 x_{5} x_{2} x_{4} w_{c} o u t o u t x_{6} x_{5}$

看上面的表格，我们要求 $w_{a, 1} = w_{c, 2}$ ， $w_{b, 1} = w_{c, 3}$ 且 $w_{c, 0} = w_{c, 1}$ 。

支持跨向量置换的直接方案是引入多个对应的置换向量，比如上表的三列向量用三个置换向量统一进行位置编码：

$i 0123 i d_{a, i} 0123 i d_{b, i} 4567 i d_{c, i} 891011$

置换后的向量为 $σ_{a}, σ_{b}, σ_{c}$ ：

$i 0123 σ_{a, i} 01023 σ_{b, i} 41167 σ_{c, i} 9815$

Prover 用一个随机数 $β$ （Verifier 提供）来合并 $(w_{a}, i d_{a})$ ， $(w_{b}, i d_{b})$ ， $(w_{c}, i d_{c})$ ，还有置换后的向量： $(w_{a}^{'}, σ_{a})$ ， $(w_{b}^{'}, σ_{b})$ ， $(w_{c}^{'}, σ_{c})$ 。然后再通过一个随机数 $γ$ （Verifier 提供）和连乘来得到 $W$ 和 $W^{'}$ 的 Multisets， ${f_{i}}$ 与 ${g_{i}}$

$f_{i} g_{i} = (w_{a, i} + β \cdot i d_{a, i} + γ) (w_{b, i} + β \cdot i d_{b, i} + γ) (w_{c, i} + β \cdot i d_{c, i} + γ) = (w_{a, i}^{'} + β \cdot σ_{a, i} + γ) (w_{b, i}^{'} + β \cdot σ_{b, i} + γ) (w_{c, i}^{'} + β \cdot σ_{c, i} + γ)$

又因为拷贝约束要求置换后的向量与原始向量相等，因此 $w_{a} = w_{a}^{'}$ ， $w_{b} = w_{b}^{'}$ ， $w_{c} = w_{c}^{'}$ 。

如果我们用多项式对 $w_{a}, w_{b}, w_{c}, i d_{a}, i d_{b}, i d_{c}, σ_{a}, σ_{b}, σ_{c}$ 编码，得到 $w_{a} (X), w_{b} (X), w_{c} (X), i d_{a} (X), i d_{b} (X), i d_{c} (X), σ_{a} (X), σ_{b} (X), σ_{c} (X)$ ，于是 $f (X)$ ， $g (X)$ 满足下面的约束关系：

$f (X) g (X) = (w_{a} (X) + β \cdot S_{i d_{a}} (X) + γ) (w_{b} (X) + β \cdot S_{i d_{b}} (X) + γ) (w_{c} (X) + β \cdot S_{i d_{c}} (X) + γ) = (w_{a} (X) + β \cdot S_{σ_{a}} (X) + γ) (w_{b} (X) + β \cdot S_{σ_{b}} (X) + γ) (w_{c} (X) + β \cdot S_{σ_{c}} (X) + γ)$

如果两个 Multiset 相等 {f_i\}={g_i}，那么下面的等式成立：

$X \in H \prod f (X) = X \in H \prod g (X)$

上面的等式稍加变形，可得

$X \in H \prod \frac{f ( X )}{g ( X )} = 1$

我们进一步构造一个辅助的累加器向量 $z$ ，表示连乘计算的一系列中间过程

$z_{0} = 1, z_{i + 1} = z_{i} \cdot \frac{f _{i}}{g _{i}}$

其中 $z_{0}$ 的初始值为 $1$ ，Prover 按照下表计算出 $z$ ：

$i 0123 ⋮ N - 1 N H_{i} ω^{0} = 1 ω^{1} ω^{2} ω^{3} ω^{N - 1} ω^{N} = 1 z_{i} 1 1 \cdot \frac{f _{0}}{g _{0}} \frac{f _{0}}{g _{0}} \cdot \frac{f _{1}}{g _{1}} \frac{f _{0} f _{1}}{g _{0} g _{1}} \cdot \frac{f _{2}}{g _{2}} ⋮ \frac{f _{0} f _{1} \dots f _{N - 3}}{g _{0} g _{1} \dots g _{N - 3}} \cdot \frac{f _{N - 2}}{g _{N - 2}} \frac{f _{0} f _{1} \dots f _{N - 1}}{g _{0} g _{1} \dots g _{N - 1}} = 1$

如果 $f$ 能与 $g$ 连乘等价的话，那么最后一行 $z_{N}$ 正好等于 $1$ ，即

$z_{N} = z_{0} = 1$

而又因为 $ω^{N} = 1$ 。这恰好使我们可以把 $(z_{0}, z_{1}, z_{2}, \dots, z_{N - 1})$ 完整地编码在乘法子群 $H$ 上。因此如果它满足下面两个多项式约束，我们就能根据数学归纳法得出 $z_{N} = 1$ ，这是我们最终想要的「拷贝约束」：

$z (ω^{0}) = 1$

$z (ω \cdot X) g (X) = z (X) f (X)$

置换关系 $σ$

在构造拷贝约束前，置换关系 $σ$ 需要提前公开共识。表格 $W$ 含有所有算术门的输入输出，但是并没有描述门和门之间是否通过引线相连，而置换关系 $σ$ 实际上正是补充描述了哪些算术门之间的连接关系。

因此，对于一个处于「空白态」的电路，通过 $(Q, σ)$ 两个表格描述，其中 $Q$ 由选择子向量构成，而 $σ$ 则由「置换向量」构成。

下面是 $Q$ 表格

$i 0123 q_{L} 0010 q_{R} 0010 q_{M} 0101 q_{C} 99000 q_{O} 1111$

下面是 $S$ 表格，描述了哪些位置做了置换

$i 0123 σ_{a, i} 01023 σ_{b, i} 4 \underline{11} 67 σ_{c, i} [9] [8] 1 \underline{5}$

处理 Public Inputs

假如在上面给出的小电路中，要证明存在一个 Assignment，使得 out 的输入为一个特定的公开值，比如 $o u t = 99$ 。最简单的办法是使用 $Q$ 表中的 $q_{C}$ 列，并增加一行约束，使得 $q_{L} = q_{R} = q_{M} = 0$ ，因此满足下面等式

$q_{C} (X) - q_{O} (X) w_{c} (X) = 0$

但这个方案的问题是：这些公开值输入输出值被固定成了常数，如果公开值变化，那么 $q_{C} (X)$ 多项式需要重新计算。如果整体上 $W$ 表格的行数比较大，那么这个重新计算过程会带来很多的性能损失。

能否在表格中引入参数，以区分电路中的常数列？并且要求参数的变化并不影响其它电路的部分？这就需要再引入一个新的列，专门存放公开参数，记为 $ϕ$ ，因此，算术约束会变为：

$q_{L} (X) w_{a} (X) + q_{R} (X) w_{b} (X) + q_{M} (X) w_{a} (X) w_{b} (X) - q_{O} (X) w_{c} (X) + q_{C} (X) + ϕ (X) = 0$

我们还可以通过修改拷贝约束的方式引入公开参数。

[!TODO]

位置向量的优化

我们上面在构造三个 $σ$ 向量时，直接采用的自然数 $(0, 1, 2, \dots)$ ，这样在协议开始前，Verifier 需要构造 3 个多项式 $S_{i d_{a}} (X), S_{i d_{b}} (X), S_{i d_{c}} (X)$ ，并且在协议最后一步查询 Oracle，获得三个多项式在挑战点 $X = ζ$ 处的取值 $(S_{i d_{a}} (ζ), S_{i d_{b}} (ζ), S_{i d_{c}} (ζ))$ 。

思考一下， $σ$ 向量只需要用一些互不相等的值来标记置换即可，不一定要采用递增的自然数。如果我们采用 $H = (1, ω, ω^{2}, \dots)$ 的话，那么多项式 $i d_{a} (X)$ 会被大大简化：

$i d_{a} i d_{b} i d_{c} = (1, ω, ω^{2}, ω^{3}) = (k_{1}, k_{1} ω, k_{1} ω^{2}, k_{1} ω^{3}) = (k_{2}, k_{2} ω, k_{2} ω^{2}, k_{2} ω^{3})$

其中 $k_{i}$ 为互相不等的二次非剩余。

$i d_{a} (X) = X, i d_{b} (X) = k_{1} \cdot X, i d_{a} (X) = k_{2} \cdot X$

这样一来，这三个多项式被大大简化，它们在 $X = ζ$ 处的计算轻而易举，可以直接由 Verifier 完成。

这个小优化手段最早由 Vitalik 提出。采用 $k_{1}$ 和 $k_{2}$ 是为了产生 $(1, ω, ω^{2}, ω^{3})$ 的陪集（Coset），并保证 Coset 之间没有任何交集。我们前面提到 $H = (1, ω, ω^{2}, ω^{3})$ 是 $F$ 的乘法子群，如果 $H_{1} = k_{1} H$ 和 $H_{2} = k_{2} H$ 存在交集，那么 $H_{1} = H_{2}$ 。这个论断可以简单证明如下：如果它们存在交集，那么 $k_{1} ω^{i} = k_{2} ω^{j}$ ，于是 $k_{1} = k_{2} \cdot ω^{j - i}$ ，又因为 $ω^{j - i} \in H$ ，那么 $k_{1} \in H_{2}$ ，那么 $\forall i \in [N] . k_{1} \cdot ω^{i} \in H_{2}$ ，那么 $H_{1} \subset H_{2}$ ，同理可得 $H_{2} \subset H_{1}$ ，于是 $H_{1} = H_{2}$ 。

如果 $σ$ 的列数更多，那么我们需要选择多个 $k_{1}, k_{2}, k_{3}, \dots$ 且 $(k_{i} / k_{j})^{N} \neq = 1$ 来产生不相交的 Coset。一种最直接的办法是采用 $k_{1}, k_{2}, k_{3}, \dots = g^{1}, g^{2}, g^{3}, \dots$ ，其中 $g$ 为乘法子群 $T$ 的生成元， $∣ T ∣ * 2^{λ} = p - 1$ 。

协议框架

预处理：Prover 和 Verifier 构造 $[q_{L} (X)]$ ， $[q_{R} (X)]$ ， $[q_{O} (X)]$ ， $[q_{M} (X)]$ ， $[q_{C} (X)]$ ， $[σ_{a} (X)]$ ， $[σ_{b} (X)]$ ， $[σ_{c} (X)]$

第一步：Prover 针对 $W$ 表格的每一列，构造 $[w_{a} (X)]$ ， $[w_{b} (X)]$ ， $[w_{c} (X)]$ ， $ϕ (X)$ 使得

$q_{L} (X) w_{a} (X) + q_{R} (X) w_{b} (X) + q_{M} (X) w_{a} (X) w_{b} (X) - q_{O} (X) w_{c} (X) + q_{C} (X) + ϕ (X) = 0$

第二步： Verifier 发送随机数 $β$ 与 $γ$ ；

第三步：Prover 构造 $[z (X)]$ ，使得

$L_{0} (X) (z (X) - 1) z (ω \cdot X) g (X) - z (X) f (X) = 0 = 0$

第四步：Verifier 发送随机挑战数 $α$ ；

第五步：Prover 计算 $h (X)$ ，并构造商多项式 $[t (X)]$

$h (X) = q_{L} (X) w_{a} (X) + q_{R} (X) w_{b} (X) + q_{M} (X) w_{a} (X) w_{b} (X) - q_{O} (X) w_{c} (X) + q_{C} (X) + ϕ (X) + α (z (ω X) \cdot g (X) - z (X) \cdot f (X)) + α^{2} (L_{0} (X) \cdot (z (X) - 1))$

其中

$f (X) g (X) = (w_{a} (X) + β \cdot i d_{a} (X) + γ) (w_{b} (X) + β \cdot i d_{b} (X) + γ) (w_{c} (X) + β \cdot i d_{c} (X) + γ) = (w_{a} (X) + β \cdot σ_{a} (X) + γ) (w_{b} (X) + β \cdot σ_{b} (X) + γ) (w_{c} (X) + β \cdot σ_{c} (X) + γ)$

其中商多项式 $t (X) = \frac{h ( X )}{z _{H} ( X )}$ ；

第六步：Verifier 发送随机挑战数 $ζ$ ，查询上述的所有 Oracle，得到

$\overset{w}{ˉ}_{a} = w_{a} (ζ)$ ， $\overset{w}{ˉ}_{b} = w_{b} (ζ)$ ， $\overset{w}{ˉ}_{c} = w_{c} (ζ)$
$\overset{q}{ˉ}_{L} = q_{L} (ζ)$ ， $\overset{q}{ˉ}_{R} = q_{R} (ζ)$ ， $\overset{q}{ˉ}_{M} = q_{M} (ζ)$ ， $\overset{q}{ˉ}_{O} = q_{O} (ζ)$ ， $\overset{q}{ˉ}_{C} = q_{C} (ζ)$
$\overset{σ}{ˉ}_{a} = σ_{a} (ζ)$ ， $\overset{σ}{ˉ}_{b} = σ_{b} (ζ)$ ， $\overset{σ}{ˉ}_{c} = σ_{c} (ζ)$
$\overset{z}{ˉ}_{(ω \cdot ζ)} = z (ω \cdot ζ)$ ， $\overset{z}{ˉ}_{(ζ)} = z (ζ)$
$\overset{ˉ}{t} = t (ζ)$

Verifier 还要自行计算

$\overset{ˉ}{f}_{(ζ)} = (\overset{w}{ˉ}_{a} + β \cdot ζ + γ) (\overset{w}{ˉ}_{b} + β \cdot k_{1} \cdot ζ + γ) (\overset{w}{ˉ}_{c} + β \cdot k_{2} \cdot ζ + γ)$
$\overset{g}{ˉ}_{(ζ)} = (\overset{w}{ˉ}_{a} + β \cdot \overset{σ}{ˉ}_{1} + γ) (\overset{w}{ˉ}_{b} + β \cdot \overset{σ}{ˉ}_{2} + γ) (\overset{w}{ˉ}_{c} + β \cdot \overset{σ}{ˉ}_{3} + γ)$
$L_{0} (ζ)$
$z_{H} (ζ)$
$ϕ (ζ)$

验证步：

$\overset{q}{ˉ}_{L} \overset{w}{ˉ}_{a} + \overset{q}{ˉ}_{R} \overset{w}{ˉ}_{b} + \overset{q}{ˉ}_{M} \overset{w}{ˉ}_{a} \overset{w}{ˉ}_{b} - \overset{q}{ˉ}_{O} \overset{w}{ˉ}_{c} + \overset{q}{ˉ}_{C} + ϕ (ζ) + α (\overset{z}{ˉ}_{(ω \cdot ζ)} \cdot \overset{g}{ˉ}_(ζ) - \overset{z}{ˉ}_{(ζ)} \cdot \overset{ˉ}{f}_{(ζ)}) + α^{2} (L_{0} (ζ) \cdot (\overset{z}{ˉ}_{(ζ)} - 1)) = ? \overset{ˉ}{t} \cdot z_{H} (ζ)$

参考文献

理解 Plonk（五）：多项式承诺

什么是多项式承诺

所谓承诺，是对消息「锁定」，得到一个锁定值。这个值被称为对象的「承诺」。

$c = co mmi t (x)$

这个值和原对象存在两个关系，即 Hiding 与 Binding。

Hiding： $c$ 不暴露任何关于 $x$ 的信息；

Binding：难以找到一个 $x^{'}, x^{'} \neq = x$ ，使得 $c = co mmi t (x^{'})$ 。

最简单的承诺操作就是 Hash 运算。请注意这里的 Hash 运算需要具备密码学安全强度，比如 SHA256, Keccak 等。除了 Hash 算法之外，还有 Pedersen 承诺等。

顾名思义，多项式承诺可以理解为「多项式」的「承诺」。如果我们把一个多项式表达成如下的公式，

$f (X) = a_{0} + a_{1} X + a_{2} X^{2} + \dots + a_{n} X^{n}$

那么我们可以用所有系数构成的向量来唯一标识多项式 $f (X)$ 。

$(a_{0}, a_{1}, a_{2}, \dots, a_{n})$

如何对一个多项式进行承诺？很容易能想到，我们可以把「系数向量」进行 Hash 运算，得到一个数值，就能建立与这个多项式之间唯一的绑定关系。

$C_{1} = SHA256 (a_{0} ∥ a_{1} ∥ a_{2} ∥ \dots ∥ a_{n})$

或者，我们也可以使用 Petersen 承诺，通过一组随机选择的基，来计算一个 ECC 点：

$C_{2} = a_{0} G_{0} + a_{1} G_{1} + \dots + a_{n} G_{n}$

如果在 Prover 承诺多项式之后，Verifier 可以根据这个承诺，对被锁定的多项式进行求值，并希望 Prover 可以证明求值的正确性。假设 $C = C o mmi t (f (X))$ ，Verifier 可以向提供承诺的 Prover 询问多项式在 $X = ζ$ 处的取值。Prover 除了回复一个计算结果之外（如 $f (ζ) = y$ ），还能提供一个证明 $π$ ，证明 $C$ 所对应的多项式 $f (X)$ 在 $X = ζ$ 处的取值 $y$ 的正确性。

多项式承诺的这个「携带证明的求值」特性非常有用，它可以被看成是一种轻量级的「可验证计算」。即 Verifier 需要把多项式 $f (X)$ 的运算代理给一个远程的机器（Prover），然后验证计算（计算量要小于直接计算 $f (X)$ ）结果 $y$ 的正确性；多项式承诺还能用来证明秘密数据（来自Prover）的性质，比如满足某个多项式，Prover 可以在不泄漏隐私的情况下向 Verifier 证明这个性质。

虽然这种可验证计算只是局限在多项式运算上，而非通用计算。但通用计算可以通过各种方式转换成多项式计算，从而依托多项式承诺来最终实现通用的可验证计算。

按上面 $C_{2}$ 的方式对多项式的系数进行 Pedersen 承诺，我们仍然可以利用 Bulletproof-IPA 协议来实现求值证明，进而实现另一种多项式承诺方案。此外，还有 KZG10 方案，FRI，Dark，Dory 等等其它方案。

KZG10 构造

与 Pedersen 承诺中用的随机基向量相比，KZG10 多项式承诺需要用一组具有内部代数结构的基向量来代替。

$(G_{0}, G_{1}, G_{2}, \dots, G_{d - 1}, H_{0}, H_{1}) = (G, χ G, χ^{2} G, \dots, χ^{d - 1} G, H, χH)$

请注意，这里的 $χ$ 是一个可信第三方提供的随机数，也被称为 Trapdoor，需要在第三方完成 Setup 后被彻底删除。它既不能让 Verifier 知道，也不能让 Prover 知道。当 $G$ 设置好之后， $χ$ 被埋入了基向量中。这样一来，从外部看，这组基向量与随机基向量难以被区分。其中 $G \in G_{1}$ ，而 $H \in G_{2}$ ，并且存在双线性映射 $e \in G_{1} \times G_{2} \to G_{T}$ 。

对于一个多项式 $f (X)$ 进行 KZG10 承诺，也是对其系数向量进行承诺：

$C_{f (X)} = a_{0} G_{0} + a_{1} G_{1} + \dots + a_{n - 1} G_{n - 1} = a_{0} G + a_{1} χ G + \dots + a_{n - 1} χ^{n - 1} G = f (χ) G$

这样承诺 $C_{f (X)}$ 巧好等于 $f (χ) G$ 。

对于双线性群，我们下面使用 Groth 发明的符号 $[1]_{1} ≜ G$ ， $[1]_{2} ≜ H$ 表示两个群上的生成元，这样 KZG10 的系统参数（也被称为 SRS, Structured Reference String）可以表示如下：

$srs = ([1]_{1}, [χ]_{1}, [χ^{2}]_{1}, [χ^{3}]_{1}, \dots, [χ^{n - 1}]_{1}, [1]_{2}, [χ]_{2})$

而 $C_{f (X)} = [f (χ)]_{1}$ 。

下面构造一个 $f (ζ) = y$ 的 Open 证明。根据多项式余数定理，我们可以得到下面的等式：

$f (X) = q (X) \cdot (X - ζ) + y$

这个等式可以解释为，任何一个多项式都可以除以另一个多项式，得到一个商多项式加上一个余数多项式。由于多项式在 $X = ζ$ 处的取值为 $y$ ，那么我们可以确定：余数多项式一定为 $y$ ，因为等式右边的第一项在 $X = ζ$ 处取值为零。所以，如果 $f (ζ) = y$ ，我们可以断定： $g (X) = f (X) - y$ 在 $X = ζ$ 处等零，所以 $ζ$ 为 $g (X)$ 的根，于是 $g (X)$ 一定可以被 $(X - ζ)$ 这个不可约多项式整除，即一定存在一个商多项式 $q (X)$ ，满足上述等式。

而 Prover 则可以提供 $q (X)$ 多项式的承诺，记为 $C_{q}$ ，作为 $f (ζ) = y$ 的证明，Verifier 可以检查 $[q (χ)]$ 是否满足整除性来验证证明。因为如果 $f (ζ) \neq = y$ ，那么 $g (X)$ 则无法被 $(X - ζ)$ 整除，即使 Prover 提供的承诺将无法通过整除性检查：

$(f (X) - y) \cdot 1 = ? q (X) \cdot (X - ζ)$

承诺 $C_{f (X)}$ 是群 $G_{1}$ 上的一个元素，通过承诺的加法同态映射关系，以及双线性映射关系 $e \in G_{1} \times G_{2} \to G_{T}$ ，Verifier 可以在 $G_{T}$ 上验证整除性关系：

$e (C_{f (X)} - y [1]_{1}, [1]_{2}) = ? e (C_{q (X)}, [χ]_{2} - ζ [1]_{2})$

有时为了减少 Verifier 在 $G_{2}$ 上的昂贵操作，上面的验证等式可以变形为：

$f (X) + ζ \cdot q (X) - y = q (X) \cdot X$

$e (C_{f (X)} + ζ \cdot C_{q (X)} - y \cdot [1]_{1}, [1]_{2}) = ? e (C_{q (X)}, [χ]_{2})$

同点 Open 的证明聚合

在一个更大的安全协议中，假如同时使用多个多项式承诺，那么他们的 Open 操作可以合并在一起完成。即把多个多项式先合并成一个更大的多项式，然后仅通过 Open 一点，来完成对原始多项式的批量验证。

假设我们有多个多项式， $f_{1} (X)$ ， $f_{2} (X)$ ，Prover 要同时向 Verifier 证明 $f_{1} (ζ) = y_{1}$ 和 $f_{2} (ζ) = y_{2}$ ，那么有

$f_{1} (X) = q_{1} (X) \cdot (X - ζ) + y_{1} f_{2} (X) = q_{2} (X) \cdot (X - ζ) + y_{2}$

通过一个随机数 $ν$ ，Prover 可以把两个多项式 $f_{1} (X)$ 与 $f_{2} (X)$ 折叠在一起，得到一个临时的多项式 $g (X)$ ：

$g (X) = f_{1} (X) + ν \cdot f_{2} (X)$

进而我们可以根据多项式余数定理，推导验证下面的等式：

$g (X) - (y_{1} + ν \cdot y_{2}) = (X - ζ) \cdot (q_{1} (X) + ν \cdot q_{2} (X))$

我们把等号右边的第二项看作为「商多项式」，记为 $q (X)$ ：

$q (X) = q_{1} (X) + ν \cdot q_{2} (X)$

假如 $f_{1} (X)$ 在 $X = ζ$ 处的求值证明为 $π_{1}$ ，而 $f_{2} (X)$ 在 $X = ζ$ 处的求值证明为 $π_{2}$ ，那么根据群加法的同态性，Prover 可以得到商多项式 $q (X)$ 的承诺：

$[q (χ)]_{1} = π = π_{1} + ν \cdot π_{2}$

因此，只要 Verifier 发给 Prover 一个额外的随机数 $ν$ ，双方就可以把两个（甚至多个）多项式承诺折叠成一个多项式承诺 $C_{g}$ ：

$C_{g} = C_{1} + ν * C_{2}$

并用这个折叠后的 $C_{g}$ 来验证多个多项式在一个点处的运算取值：

$y_{g} = y_{1} + ν \cdot y_{2}$

从而把多个求值证明相应地折叠成一个，Verifier 可以一次验证完毕：

$e (C - y * G_{0}, H_{0}) = ? e (π, H_{1} - x * H_{0})$

由于引入了随机数 $ν$ ，因此多项式的合并不会影响承诺的绑定关系（Schwartz-Zippel 定理）。

协议：

公共输入： $C_{f_{1}} = [f_{1} (χ)]_{1}$ ， $C_{f_{2}} = [f_{2} (χ)]_{1}$ ， $ζ$ ， $y_{1}$ ， $y_{2}$

私有输入： $f_{1} (X)$ ， $f_{2} (X)$

证明目标： $f_{1} (ζ) = y_{1}$ ， $f_{2} (ζ) = y_{2}$

第一轮：Verifier 提出挑战数 $ν$

第二轮：Prover 计算 $q (X) = f_{1} (X) + ν \cdot f_{2} (X)$ ，并发送 $π = [q (χ)]_{1}$

第三轮：Verifier 计算 $C_{g} = C_{f_{1}} + ν \cdot C_{f_{2}}$ ， $y_{g} = y_{1} + ν \cdot y_{2}$

$e (C_{g} - [y_{g}]_{1}, [1]_{2}) = ? e (π, [χ - ζ]_{2})$

多项式约束与线性化

假设 $[f (χ)]_{1}, [g (χ)]_{1}, [h (χ)]_{1}$ 分别是 $f (X), g (X), h (X)$ 的 KZG10 承诺，如果 Verifier 要验证下面的多项式约束：

$f (X) + g (X) = ? h (X)$

那么 Verifier 只需要把前两者的承诺相加，然后判断是否等于 $[h (χ)]_{1}$ 即可

$[f (χ)]_{1} + [g (χ)]_{1} = ? [h (χ)]_{1}$

如果 Verifier 需要验证的多项式关系涉及到乘法，比如：

$f (X) \cdot g (X) = ? h (X)$

最直接的方法是利用双线性群的特性，在 $G_{T}$ 上检查乘法关系，即验证下面的等式：

$e ([f (χ)]_{1}, [g (χ)]_{2}) = ? e ([h (χ)]_{1}, [1]_{2})$

但是如果 Verifier 只有 $g (X)$ 在 $G_{1}$ 上的承诺 $[g (χ)]_{1}$ ，而非是在 $G_{2}$ 上的承诺 $[g (χ)]_{2}$ ，那么Verifer 就无法利用双线性配对操作来完成乘法检验。

另一个直接的方案是把三个多项式在同一个挑战点 $X = ζ$ 上打开，然后验证打开值之间的关系是否满足乘法约束：

$f (ζ) \cdot g (ζ) = ? h (ζ)$

同时 Prover 还要提供三个多项式求值的证明 $(π_{f (ζ)}, π_{g (ζ)}, π_{h (ζ)})$ 供 Verifier 验证。

这个方案的优势在于多项式的约束关系可以更加复杂和灵活，比如验证下面的稍微复杂些的多项式约束：

$f_{1} (X) f_{2} (X) + h_{1} (X) h_{2} (X) h_{3} (X) + g (X) = 0$

假设 Verifier 已拥有这些多项式的 KZG10 承诺， $[f_{1} (χ)]_{1}$ ， $[f_{2} (χ)]_{1}$ ， $[h_{1} (χ)]_{1}$ ， $[h_{2} (χ)]_{1}$ ， $[h_{3} (χ)]_{1}$ ， $[g (χ)]_{1}$ 。最直接粗暴的方案是让 Prover 在挑战点 $X = ζ$ 处打开这 6 个承诺，发送 6 个 Open 值和对应的求值证明：

$(f_{1} (ζ), π_{f_{1}}), (f_{2} (ζ), π_{f_{2}}), (h_{1} (ζ), π_{h_{1}}), (h_{2} (ζ), π_{h_{2}}), (h_{3} (ζ), π_{h_{3}}), (g (ζ), π_{g})$

Verifier 验证 $6$ 个求值证明，并且验证多项式约束：

$f_{1} (ζ) f_{2} (ζ) + h_{1} (ζ) h_{2} (ζ) h_{3} (ζ) + g (ζ) = ? 0$

我们可以进一步优化，比如考虑对于 $f (X) \cdot g (X) = h (X)$ 这样一个简单的多项式约束，Prover 可以减少 Open 的数量。比如 Prover 先 Open $\overset{ˉ}{f} = f (ζ)$ ，发送求值证明 $π_{f (ζ)}$ 然后引入一个辅助多项式 $L (X) = \overset{ˉ}{f} \cdot g (X) - h (X)$ ，再 Open $L (X)$ 在 $X = ζ$ 处的取值。

显然对于一个诚实的 Prover， $L (ζ)$ 求值应该等于零。对于 Verifier，它在收到 $\overset{ˉ}{f}$ 之后，就可以利用承诺的加法同态性，直接构造 $L (X)$ 的承诺：

$[L (χ)]_{1} = \overset{ˉ}{f} \cdot [g (χ)]_{1} - [h (χ)]_{1}$

这样一来，Verifier 就不需要单独让 Prover 发送 $L (X)$ 的 Opening，也不需要发送新多项式 $L (X)$ 的承诺。Verifier 然后就可以验证 $f (X) \cdot g (X) = h (X)$ 这个多项式约束关系：

$e ([L (χ)]_{1}, [1]_{2}) = ? e (π_{L (ζ)}, [χ - ζ]_{2})$

这个优化过后的方案，Prover 只需要 Open 两次。第一个 Opening 为 $\overset{ˉ}{f}$ ，第二个 Opening 为 $0$ 。而后者是个常数，不需要发送给 Verifier。Prover 只需要发送两个求值证明，不过我们仍然可以用上一节提供的聚合证明的方法，通过一个挑战数 $ν$ ，Prover 可以聚合两个多项式承诺，然后仅需要发送一个求值证明。

我们下面尝试优化下 $6$ 个多项式的约束关系的协议： $f_{1} (X) f_{2} (X) + h_{1} (X) h_{2} (X) h_{3} (X) + g (X) = 0$ 。

协议：

公共输入： $C_{f_{1}} = [f_{1} (χ)]_{1}$ ， $C_{f_{2}} = [f_{2} (χ)]_{1}$ ， $C_{h_{1}} = [h_{1} (χ)]_{1}$ ， $C_{h_{2}} = [h_{2} (χ)]_{1}$ ， $C_{h_{3}} = [h_{3} (χ)]_{1}$ ， $C_{g} = [g (χ)]_{1}$ ，

私有输入： $f_{1} (X)$ ， $f_{2} (X)$ ， $h_{1} (X)$ ， $h_{2} (X)$ ， $h_{3} (X)$ ， $g (X)$

证明目标： $f_{1} (X) f_{2} (X) + h_{1} (X) h_{2} (X) h_{3} (X) + g (X) = 0$

第一轮：Verifier 发送 $X = ζ$

第二轮：Prover 计算并发送三个Opening， $\overset{ˉ}{f_{1}} = f_{1} (ζ)$ ， $\overset{ˉ}{h}_{1} = h_{1} (ζ)$ ， $\overset{ˉ}{h}_{2} = h_{2} (ζ)$ ，

第三轮：Verifier 发送 $ν$ 随机数

第四轮：Prover 计算 $L (X)$ ，利用 $ν$ 折叠 $(L (X), f_{1} (X), h_{1} (X), h_{2} (X))$ 这四个承诺，并计算商多项式 $q (X)$ ，发送其承诺 $[q (χ)]_{1}$ 作为折叠后的多项式在 $X = ζ$ 处的求值证明

$L (X) = \overset{ˉ}{f}_{1} \cdot f_{2} (X) + \overset{ˉ}{h}_{1} \overset{ˉ}{h}_{2} \cdot h_{3} (X) + g (X)$

$q (X) = \frac{1}{X - ζ} (L (X) + ν \cdot (f_{1} (X) - \overset{ˉ}{f}_{1}) + ν^{2} \cdot (h_{1} (X) - \overset{ˉ}{h}_{1}) + ν^{3} \cdot (h_{2} (X) - \overset{ˉ}{h}_{2}))$

第五轮：Verifier 计算辅助多项式 $L (X)$ 的承诺 $[L]_{1}$ ：

$[L]_{1} = \overset{ˉ}{f}_{1} \cdot [f_{2} (χ)]_{1} + \overset{ˉ}{h}_{1} \overset{ˉ}{h}_{2} \cdot [h_{3} (χ)]_{1} + [g (χ)]_{1}$

计算折叠后的多项式的承诺：

$[F]_{1} = [L]_{1} + ν \cdot [f_{1} (χ)]_{1} + ν^{2} [h_{1} (χ)]_{1} + ν^{3} [h_{2} (χ)]_{1}$

计算折叠后的多项式在 $X = ζ$ 处的求值：

$E = ν \cdot \overset{ˉ}{f}_{1} + ν^{2} \cdot \overset{ˉ}{h}_{1} + ν^{3} \cdot \overset{ˉ}{h}_{2}$

检查下面的验证等式：

$e ([F]_{1} - [E]_{1} + ζ [q (χ)]_{1}, [1]_{2}) = ? e ([q (χ)]_{1}, [χ]_{2})$

这个优化后的协议，Prover 仅需要发送三个 Opening，一个求值证明；相比原始方案的 6 个 Opening和 6 个求值证明，大大减小了通信量（即证明大小）。

Reference

理解 Plonk（六）：实现 Zero Knowledge

在前文的 Plonk 协议中，所有的多项式承诺都没有混入额外的随机数进行保护，因此当一个未被随机化的多项式承诺 $f (X)$ 经过一次或者多次 Open，会泄露 $f (X)$ 自身的信息，这会限制协议在需要隐私保护的场景中应用。

考虑一个 $3$ 次多项式 $f (X)$ ，只要它在四个不同的点上 Open ，多项式就可以通过 Lagrange 插值来复原。然而即使一个次数超过一百万的多项式，哪怕被打开一次也会泄漏关于原多项式的部分信息。

为了实现 Zero Knowledge 性质的 Plonk，我们需要在多项式中加入足够多的随机因子，确保在多项式打开 $k$ 次之后，仍然不会泄漏原多项式的信息，保证没有知识泄漏。

Plonk 协议的大致流程为：Prover 构造多项式，然后发送多项式的承诺给 Verifier。然后 Verfier 挑战两个随机挑战点 $X = ζ$ 与 $X = ω \cdot ζ$ ，其中 $ω$ 为子群 $H$ 的生成元。下面是 Prover 需要构造的多项式列表：

Witness 多项式： $w_{a} (X), w_{b} (X), w_{c} (X)$
置换累乘多项式： $z (X)$
商多项式： $t_{l o w} (X)$ ， $t_{mi d} (X)$ ， $t_{hi g h} (X)$

其中三个 Witness 多项式要在 $X = ζ$ 这一个点处打开，置换累乘多项式 $z (X)$ 要在 $X = ζ$ ， $X = ω \cdot ζ$ 两个点处打开，而三个商多项式则不需要被打开。

Prover 要混入两类随机因子，第一类是保护承诺本身，满足信息隐藏 Hiding，一个承诺一般只需要混入一个随机数即可；第二类是保护多项式承诺在打开之后仍然保证原多项式信息不会泄漏。如果多项式打开的次数越多（假设每次打开的位置都不同）， Prover 就要混入越多的随机因子。

第一类的随机因子，也可以用多项式承诺方案来实现，比如 Bulletproof-IPA，或者 KZG10-with-Hiding，这些多项式承诺方案本身已经支持 Hiding 。如果 Plonk 后端采用的是朴素的 KZG10，那么就需要在 Plonk 协议层面增加足够的随机因子，不仅保证承诺自身的 Hiding 性质，还要保护承诺的打开。

下面我们介绍两个不同的混入随机因子方案实现 Zero Knowledge 的方法。第一个方法比较经典，是为多项式加上一个盲化（Blinding）用途的多项式，GWC19 论文[3]（或其它学术论文）中正是采用的这种方法。而第二个方法是在向量的对齐填充空间里面填入随机数，再插值产生多项式的，这是工程实现中的常见方法。

方法一：Blinding 多项式

我们先看 Witness 多项式 $w_{a} (X)$ ，它是由下面的等式计算：

$w_{a} (X) = w_{a, 0} L_{0} (X) + w_{a, 1} L_{1} (X) + w_{a, 2} L_{2} (X) + \dots + w_{a, n - 1} L_{n - 1} (X)$

我们假设 $n \leq N$ ，其中 $N = ∣ H ∣$ 。

在 Plonk 协议中，Prover 需要计算 $w_{a} (ζ)$ 的取值，其中 $ζ$ 为 Verifier 给出的随机挑战点。

如果我们直接鲁莽地在 $w_{a} (X)$ 中混入随机数 $b_{0}$ ，比如 $w_{a}^{'} (X) = w_{a} (X) + b_{0}$ ，那么 $w_{a}^{'} (X)$ 可能就不再满足算术约束：

$q_{L} (X) w_{a}^{'} (X) + q_{R} (X) w_{b} (X) + q_{M} (X) w_{a} (X) w_{b} (X) - q_{O} (X) w_{c} (X) + q_{C} (X) + ϕ (X) \neq = t (X) \cdot z_{H} (X)$

而且也无法满足置换约束。

如果要让随机化后的多项式 $w_{a}^{'} (X)$ 满足「算术约束」和「置换约束」，那么我们可以考虑在乘法子群 $H$ 之外增加一些随机的点，这样可以让随机化后的多项式 $w_{a}^{'} (X)$ 在 $H$ 整个乘法子群上的取值仍然与 $w_{a} (X)$ 完全相等，但是整个多项式却已经被随机化了。所谓的在 $H$ 上的取值相等，就是保证随机化后的多项式仍然可以被 $z_{H} (X)$ 整除。下面是随机化多项式的构造：

$w_{a}^{'} (X) = (b_{1} X + b_{0}) \cdot z_{H} (X) + w_{a} (X)$

这里 $b_{1} X + b_{0}$ 为 Blinding 多项式，包含两个随机因子 $(b_{0}, b_{1})$ ，它们恰好是自变量的不同次数的系数，这样可以保证线性不相关。换个方式理解，只有对这个 Blinding 多项式打开两次以上，才可以计算出所有的随机因子。如果只打开一次，Blinding 多项式会被消耗掉一个随机因子，还剩下一个起作用的随机因子。

简单检查下，我们可以发现新定义的 $w_{a}^{'} (X)$ 符合要求，能满足算术约束。同时因为 $w_{a}^{'} (X) = w_{a} (X), \forall x \in H$ ，因此 $w_{a}^{'} (X)$ 也一定满足置换关系。

这里 $w_{a}^{'} (X)$ 被混入了两个随机因子，其中一个随机因子可以保护 $[w_{a}^{'} (x)]$ 被打开一次，另一个随机因子用来实现承诺 $[w_{a}^{'} (x)]$ 本身的信息隐藏。

考虑下置换累乘多项式 $z (X)$ ，假如多项式承诺 $[z (X)]$ 被打开两次的话，那么就需要混入三个随机因子，构造一个次数为 $2$ 的 Blinder 多项式， $b_{0} + b_{1} X + b_{2} X^{2}$ ，然后混入到 $z (X)$ 中：

$z^{'} (X) = (b_{0} + b_{1} X + b_{2} X^{2}) \cdot z_{H} (X) + z (X)$

最后考虑商多项式 $t_{l o w} (X)$ ， $t_{mi d} (X)$ ， $t_{hi g h} (X)$ ，由于他们不需要在任何点打开，因此只要加上随机因子即可，不过这几个商多项式有额外的要求，即他们三个需要一起能拼出真正的商多项式 $t (X)$ ：

$t (X) = t_{l o w} (X) + t_{mi d} (X) \cdot X^{N} + t_{hi g h} (X) \cdot X^{2 N}$

我们可以采用下面的方式，为每一个多项式分片混入一个随机因子，并且保证他们拼起来之后仍然等于 $t (X)$ ：

$t_{l o w}^{'} (X) t_{mi d}^{'} (X) t_{hi g h}^{'} (X) = t_{l o w} (X) + b_{0} X^{N} = t_{mi d} (X) - b_{0} + b_{1} X^{N} = t_{hi g h} (X) - b_{1}$

容易检验：

$= = = t_{l o w}^{'} (X) + t_{mi d}^{'} (X) \cdot X^{N} + t_{hi g h}^{'} (X) \cdot X^{2 N} t_{l o w} (X) + b_{0} X^{N} + (t_{mi d} (X) - b_{0} + b_{1} X^{N}) \cdot X^{N} + (t_{hi g h} (X) - b_{1}) \cdot X^{2 n} t_{l o w} (X) + t_{mi d} (X) \cdot X^{N} + t_{hi g h} (X) \cdot X^{2 N} t (X)$

同理，如果 $t (X)$ 的次数达到了 $4 N$ ，那么就需要三个随机数给四个 $t (X)$ 分段加上随机数，实现 Hiding。

这个方法存在一个问题，就是 Blinding 多项式的次数会超过 $N$ ，这里 $N = ∣ H ∣$ 。因为 $z_{H} (X)$ 的次数为 $N$ ，因此 $(b_{1} X + b_{0}) \cdot z_{H} (X)$ 次数为 $N + 1$ 。如果 Plonk 后端采用的是 Bulletproof-IPA 这类的多项式承诺，承诺会要求多项式的次数按 $2^{k}$ 对齐，这样盲化之后的多项式的次数刚刚超出 $N$ ，只能对齐到 $2 N$ 。一些 Plonk 变种协议可能会把 Witness table 的列数增加，稍稍超出的多项式次数会使 $t (X)$ 的计算在一个更大的子群上完成。

方法二：随机因子对齐

下面介绍的第二种方法不会推高多项式的次数。考虑到 $H$ 子群的大小 $N$ 是按 $2^{k}$ 对齐，在实际电路中，一般情况下需要把 Witness Table 的长度对齐到 $N$ ，为了对齐，需要把空余的空间用零填满。

那么这里可以用随机数来代替零填充对齐空间，好处是这些随机数可以保护表中的其它正常数据。

Daniel Lubarov 按照这个思路给出了第二种随机数填充实现 Zero-Knowledge 性质的办法[1]。

对于商多项式，因为方法一不会推高他们的次数，因此我们下面只考虑剩下的两类多项式：

Witness 多项式： $w_{a} (X), w_{b} (X), w_{c} (X)$
置换累乘多项式： $z (X)$

先看第一类多项式，以 $w_{a} (X)$ 为例，它编码了 $w_{a, i}$ 向量。如果本身向量长度不足 $N$ ，一般情况下是用零补齐，我们现在可以考虑让 Prover 额外用两个随机数补齐，这样做的效果和方法一的 Blinding 多项式完全一样。如下所示：

$w_{a}^{'} (X) = w_{a} (X) + (b_{0} \cdot L_{N - 2} (X) + b_{1} \cdot L_{N - 1} (X))$

其中 $b (X) = b_{0} \cdot L_{N - 2} (X) + b_{1} \cdot L_{N - 1} (X)$ 也可以看成是利用 Lagrange Basis 产生的 Blinding 多项式。这里假设 ${w_{a, i}}$ 的长度为 $N - 2$ ， $(b_{0}, b_{1})$ 为两个随机数。假设 $w_{a} (X)$ 的系数为固定值，那么当 $w_{a}^{'} (X)$ 被打开两次之后， $b (X) = b_{0} \cdot L_{N - 2} (X) + b_{1} \cdot L_{N - 1} (X)$ 的系数即可被求解，从而失去随机化的能力。因此， $w_{a}^{'} (X)$ 只能承受一次安全的打开操作（假设协议基于 Non-hiding 的多项式承诺）。

对于置换累乘多项式 $z (X)$ ，则需要在累乘向量 $z$ 的尾部引入随机值。考虑下 $z$ 的计算方式：

$z_{i + 1} = z_{i} \cdot \frac{( w _{a} ( X ) + β \cdot X + γ ) ( w _{b} ( X ) + β \cdot k _{1} X + γ ) ( w _{c} ( X ) + β \cdot k _{2} X + γ )}{( w _{a} ( X ) + β \cdot σ _{a} ( X ) + γ ) ( w _{b} ( X ) + β \cdot σ _{b} ( X ) + γ ) ( w _{c} ( X ) + β \cdot σ _{c} ( X ) + γ )}$

列出所有的 $z_{i}$ 的计算如下：

$i 0123 ⋮ N - 2 N - 1 N H_{i} ω^{0} = 1 ω^{1} ω^{2} ω^{3} ω^{N - 2} ω^{N - 1} ω^{N} = 1 z_{i} 1 1 \cdot \frac{f _{0}}{g _{0}} \frac{f _{0}}{g _{0}} \cdot \frac{f _{1}}{g _{1}} \frac{f _{0} f _{1}}{g _{0} g _{1}} \cdot \frac{f _{2}}{g _{2}} ⋮ \frac{f _{0} f _{1} \dots f _{N - 4}}{g _{0} g _{1} \dots g _{N - 4}} \cdot \frac{f _{N - 3}}{g _{N - 3}} \frac{f _{0} f _{1} \dots f _{N - 3}}{g _{0} g _{1} \dots g _{N - 3}} \cdot \frac{f _{N - 2}}{g _{N - 2}} \frac{f _{0} f _{1} \dots f _{N - 1}}{g _{0} g _{1} \dots g _{N - 1}} = 1$

假如我们想设置 $z_{N - 1}$ 为随机值，我们需要让 $w_{a, N - 1}$ 和 $w_{a, N - 2}$ 这两个元素设置一个 Copy Constraint，并填上同一个随机数 $ρ_{1}$ 。如果 $w_{b, N - 1}$ 和 $w_{b, N - 2}$ 设置为零，那么

$\frac{f _{N - 2}}{g _{N - 2}} = \frac{( ρ _{1} + β \cdot ω ^{N - 2} + γ )}{( ρ _{1} + β \cdot ω ^{N - 1} + γ )}$

又因为

$z_{N - 1} = z_{N - 2} \cdot \frac{f _{N - 2}}{g _{N - 2}}$

那么 $z_{N - 1}$ 的概率分布与 $ρ_{1}$ 相同。这样我们通过把 Witness Table 的最后两行用来填入随机数 $ρ_{1}$ ，并且设置一个 Copy Constraint 来随机化 $z_{N - 1}$ 。如果要再引入一个随机数 $ρ_{2}$ ，一种方法是我们再征用 Witness table 的两行， $i = N - 4, N - 3$ ，可以让 $z_{N - 4}$ 随机化。或者我们节省下空间，利用 $w_{b, N - 3}$ 与 $w_{b, N - 2}$ 来构造一个随机数 $ρ_{2}$ 的 Copy Constraint。同理，我们可以再用两行 $i = N - 4, N - 3$ 来引入 $ρ_{3}$ 。这样，我们总共征用了四行，引入了三个随机数 $ρ_{1}, ρ_{2}, ρ_{3}$ ：

$i 0 ⋮ N - 4 N - 3 N - 2 N - 1 w_{a} \dots ⋮ ρ_{3} ρ_{3} ρ_{1} ρ_{1} w_{b} \dots ⋮ 0 ρ_{2} ρ_{2} 0 w_{c} \dots ⋮ 0000$

$i 0 ⋮ N - 4 N - 3 N - 2 N - 1 σ_{a} \dots ⋮ ω^{- 3} ω^{- 4} ω^{- 1} ω^{- 2} σ_{b} \dots ⋮ k_{1} ω^{- 4} k_{1} ω^{- 2} k_{1} ω^{- 3} k_{1} ω^{- 1} σ_{c} \dots ⋮ k_{2} ω^{- 4} k_{2} ω^{- 3} k_{2} ω^{- 2} k_{2} ω^{- 1}$

最后我们推导一下 $z_{N - 3}, z_{N - 2}, z_{N - 1}$ ，请注意 $z_{N - 4} = 1$ ，因为前面的 Permutation 项都已经消完。

$z_{N - 3} = \frac{( ρ _{3} + β \cdot ω ^{N - 4} + γ )}{( ρ _{3} + β \cdot ω ^{N - 3} + γ )}$

$z_{N - 2} = z_{N - 3} \cdot \frac{( ρ _{3} + β \cdot ω ^{N - 3} + γ ) ( ρ _{2} + β \cdot k _{1} ω ^{N - 3} + γ )}{( ρ _{3} + β \cdot ω ^{N - 4} + γ ) ( ρ _{2} + β \cdot k _{1} ω ^{N - 2} + γ )} = \frac{( ρ _{2} + β \cdot k _{1} ω ^{N - 3} + γ )}{( ρ _{2} + β \cdot k _{1} ω ^{N - 2} + γ )}$

$z_{N - 1} = z_{N - 2} \cdot \frac{( ρ _{1} + β \cdot ω ^{N - 2} + γ ) ( ρ _{2} + β \cdot k _{1} ω ^{N - 2} + γ )}{( ρ _{1} + β \cdot ω ^{N - 1} + γ ) ( ρ _{2} + β \cdot k _{1} ω ^{N - 3} + γ )} = \frac{( ρ _{1} + β \cdot ω ^{N - 2} + γ )}{( ρ _{1} + β \cdot ω ^{N - 1} + γ )}$

于是 $z_{N - 3}, z_{N - 2}, z_{N - 1}$ 中各自包含了一个随机数。请注意这个方法需要在 Witness table 中留有足够的 padding 空间，并且 $z (X)$ 的盲化因子不能与 $w_{a} (X), w_{b} (X), w_{c} (X)$ 的重复，那么总共需要留出 6 排空间，并且把 $w_{a}^{'} ()$ 盲化因子提前到第 $N - 5$ 与 $N - 6$ 排：

$w_{a}^{'} (X) w_{b}^{'} (X) w_{c}^{'} (X) = w_{a} (X) + (b_{0} \cdot L_{N - 6} (X) + b_{1} \cdot L_{N - 5} (X)) = w_{b} (X) + (b_{2} \cdot L_{N - 6} (X) + b_{3} \cdot L_{N - 5} (X)) = w_{c} (X) + (b_{4} \cdot L_{N - 6} (X) + b_{5} \cdot L_{N - 5} (X))$

满足 Hiding 性质的 KZG10

在 Daniel Lubarov 的 Blog 中讲述的方案是基于带有 Hiding 性质的多项式承诺 IPA（Inner product argument）。因此在 $w_{a} (X), w_{b} (X), w_{c} (X)$ 中只需要混入一个随机因子， $z (X)$ 中只混入两个随机因子。

但是我们也可以选择一个带有 Hiding 性质的 KZG10 承诺方案，这样也可以按照 Halo2 方式混入较少的随机数实现 Zero-knowledge。

这个方案参考了 Marlin 论文[2]的 Appendix B.3，基于 AGM 模型的 KZG10-with-hiding。

在 Setup 阶段，我们需要产生两倍长的 srs：

$srs = ([1]_{1}, [ρ]_{1}, [χ]_{1}, [ρ χ]_{1}, [χ^{2}]_{1}, [ρ χ^{2}]_{1}, \dots, \dots, [χ^{D}]_{1}, [ρ χ^{D}]_{1},), ([1]_{1}, [ρ]_{1}, [1]_{1}, [χ]_{2})$

如果我们要承诺一个多项式 $f (X) = f_{0} + f_{1} X + \dots + f_{n - 1} X^{n - 1}$ ，那么需要额外产生一个次数相同的 Blinder 多项式：

$r (X) = r_{0} + r_{1} X + \dots + r_{n - 1} X^{n - 1}$

然后计算承诺：

$C_{f} = i = 0 \sum n - 1 f_{i} \cdot [χ^{i}]_{1} + i = 0 \sum n - 1 r_{i} \cdot [ρ χ^{i}]_{1} = [f (χ) + ρ \cdot r (χ)]_{1}$

如果我们要在 $X = ζ$ 处打开一个多项式承诺，先计算 $y = f (ζ)$ ，还要计算盲化多项式 $r (X)$ 在 $X = ζ$ 的求值， $y^{'} = r (ζ)$ ，然后产生这两个多项式的求值证明：

$q (X) = f (X) + ρ \cdot r (X) = \frac{f ( X ) - f ( ζ )}{X - ζ} + ρ \cdot \frac{r ( X ) - r ( ζ )}{X - ζ}$

$π_{f (ζ)} = ([q_{(} X)]_{1}, y^{'})$

检查求值证明的方式如下：

$e (C_{f} - y \cdot [1]_{1} - y^{'} \cdot [ρ]_{1}, [1]_{2}) = ? e ([q (X)]_{1}, [χ]_{2} - ζ \cdot [1]_{2})$

我们可以看到为了实现 Hiding，计算承诺和打开承诺的成本会加倍。如果我们限定多项式只能被打开一次（或者有限次），那么我们可以采用更低次数的盲化多项式 $r (X)$ 。假如我们只考虑多项式最多被打开一次的情况，那么 $r (X)$ 只需要是一个一次多项式，同时也可以减少 srs 的尺寸。

$r (X) = r_{0} + r_{1} X$

最后请注意的是，仅有实现 Hiding 的多项式承诺不足以实现 Plonk 的 Zero-knowledge，仍然需要在 Plonk 协议层面混入足够的随机的盲化因子。

参考文献

[1] Adding zero knowledge to Plonk-Halo https://mirprotocol.org/blog/Adding-zero-knowledge-to-Plonk-Halo
[2] Chiesa, Alessandro, Yuncong Hu, Mary Maller, Pratyush Mishra, Noah Vesely, and Nicholas Ward. “Marlin: Preprocessing zkSNARKs with universal and updatable SRS.” In Advances in Cryptology–EUROCRYPT 2020: 39th Annual International Conference on the Theory and Applications of Cryptographic Techniques, Zagreb, Croatia, May 10–14, 2020, Proceedings, Part I 39, pp. 738-768. Springer International Publishing, 2020. https://eprint.iacr.org/2019/1047.
[3] Gabizon, Ariel, Zachary J. Williamson, and Oana Ciobotaru. “Plonk: Permutations over lagrange-bases for oecumenical noninteractive arguments of knowledge.” Cryptology ePrint Archive (2019).

理解 PLONK（七）：Lookup Gate

传统上我们通过编写算术电路来表达逻辑或者计算。而算术电路只有两种基本门：「加法门」与「乘法门」。当然通过组合，我们可以基于加法和乘法构造复杂一点的元件（Gadget）来复用，但是在电路处理过程中，这些 Gadget 还是会被展开成加法门和乘法门的组合。

自然我们想问：能否使用除加法和乘法之外的「新计算门」？

Plonk 相关的工作给出了一个令人兴奋的扩展：我们有能力构造出更复杂些的基本计算单元。如果一个计算的输入和输出满足一个预先设定的多项式的话，那么这个计算可以作为基本计算单元，这个改进被称为「Custom Gate」，实际上你可以理解为这是一种多输入的「多项式门」。

故事还没有结束，论文 GW20 又给出了一个制造「Lookup Gate」的方法。这个门的输入输出没有必要局限于多项式关系，而是可以表达「任意的预定义关系」。What? 任意的关系？是的，你没听错，尽管这有点令人难以置信。

思路不难理解：如果我们在电路之外预设一个表格，表中每一行表示特定计算的输入输出关系，例如：

in1	in2	in3	out
1	2	3	4
5	6	7	8
1	1	5	9

这个表格就代表一个 Lookup 门的定义。如果你问我这个门究竟表达了什么计算，我无法回答（乱写的）。不过只要能给出这样一张表格，我们就可以在电路里面接入一个门，它的输入输出关系「存在于表中的某一行」。

这种门被称为 Lookup Gate，即查表门（或查表约束）。

如果当我们在 Plonk 电路中接入查表门，那么 Plonk 协议就要检查这个门的输入输出是否合法，然后就会去查我们实现预设的表格，看看其输入输出关系是否能在表中找到对应的一行。如果表中存在这样的条目，那么这个门就合法，否则被视为非法。

在现实应用中，最多采用查表方式的门是关于位运算。如一个 8-bit 异或运算，只需要 $2^{16}$ 大小的表格即可。此外对于采用大量位运算的 SHA256算法，也可以通过建立一个 Spread Table 来大大加速各种位运算的效率。

基本思路

实现查表门的一个关键技术是 Lookup Argument 协议，即如何证明一条（或多条）记录是否存在于一个公开的表中。

可能有朋友会条件反射想到 Merkle Tree，如果我们把表格按行计算 hash，这些 hash 就可以产生一个 Merkle Root，然后通过 Merkle Path 就能证明一条记录是否存在表格中。但是这个方法（以及所有的 Vector Commitment 方案）不适合查表场景。原因有两个，一是这种方案会暴露记录在表格中的位置。假如 Prover 想隐藏记录的信息，即在查询证明不暴露位置，那么仅 Merkle Tree 就难以胜任了。理论点说，这里我们需要 Set-Membership Argument，而非 Vector-Membership Argument。第二个原因：如果有大量的记录条目（比如条目数量为 $d$ ）需要查表，那么所产生的证明即 Merkle Path，可能会比较大，最坏情况是 $O (d lo g n)$ 。

简而言之，我们需要一种新的，并且高效的查表协议。本文介绍两个常见的查表协议，为了简化表述，我们先只考虑单列表格的查询，然后再扩展到多列表格的情况。

Halo2-lookup 方案

基于 Permutation Argument，Halo2 给出了一个简洁易懂的 Lookup Argument 方案。

假如我们有一个表格向量 $t = (t_{0}, t_{1}, t_{2}, \dots, t_{n - 1})$ ，表格中不存在相同元素。然后有一个查询向量 $f = (f_{0}, f_{1}, f_{2}, \dots, f_{m - 1})$ ，我们接下来要证明 $f \subseteq t$ ，请注意 $f$ 中会有重复元素。

我们引入一个关键的辅助向量 $f^{'}$ ，它是 $f$ 的一个重新排序（置换），使得 $f$ 中的所有查询记录都按照 $t$ 的顺序进行排序，比如 $t = (1, 2, 3, 4, 5, 6, 7, 8)$ ， $f = (3, 1, 4, 2, 7, 1, 7, 2)$ ，那么重排后， $f^{'} = (1, 1, 2, 2, 3, 4, 7, 7)$ 。

可以看出， $f^{'}$ 中的重复元素被放在了一起，并且整体上按照 $t$ 中元素出现的顺序。我们把 $f^{'}$ 中连续重复元素的第一个标记出来：

$f^{'} = (1, 1, 2, 2, 3, 4, 7, 7)$

我们再引入一个辅助向量 $t^{'}$ ，它是对 $t$ 的重新排序，使得 $f^{'}$ 中被标记元素可以正好对应到 $t^{'}$ 中相同位置上的元素：

$t^{'} = (1, 5, 2, 6, 3, 4, 7, 8)$

请注意看 $t^{'}$ ，其中被方框标记的元素和 $f^{'}$ 中相同位置的方框元素值完全相同，未被标记的元素则没有出现在 $f^{'}$ 中。

于是我们可以找出一个规律： $f^{'}$ 中的每一个未标记元素等于它左边的相邻元素，而每一个被标记元素等于 $t^{'}$ 同位置元素，即 $f_{i}^{'} = f_{i - 1}^{'}$ 或者 $f_{i}^{'} = t_{i}^{'}$ 。

将两个向量 $f$ 和 $t$ 与重排向量 $f^{'}$ 和 $t^{'}$ 通过 Lagrange Basis 进行多项式编码，我们得到 $t (X)$ , $f (X)$ , $f (X)^{'}$ 和 $t^{'} (X)$ ，他们会满足下面的等式：

$(f^{'} (X) - f^{'} (ω^{- 1} \cdot X)) \cdot (f^{'} (X) - t^{'} (X)) = 0, \forall x \in H$

但上面这个等式不足以约束重排向量的可靠性。考虑如果 $f^{'} = (9, 9, 9, 9, 9, 9, 9, 9)$ ，也会满足上面的等式，但是 $f^{'}$ 并不是合法的查询记录。因此，我们还要加入一条约束防止出现 $f^{'}$ 在 $H$ 上循环回卷导致的漏洞：要求 $f^{'}$ 和 $t^{'}$ 两个向量的第一个元素必须相同，即 $f_{0}^{'} = t_{0}^{'}$ ，用多项式约束表达如下：

$L_{0} (X) \cdot (f^{'} (X) - t^{'} (X)) = 0, \forall x \in H$

剩下的工作是证明 $(f, f^{'})$ 满足某一个「置换」关系，且 $(t, t^{'})$ 也满足某个「置换」关系。由于，这两个置换关系只不需要约束具体的置换向量，因此我们可以直接采用 Grand Product Argument 来约束这两个置换关系：

$\frac{z ( ω \cdot X )}{z ( X )} = \frac{( f ( X ) + γ _{1} ) ( t ( X ) + γ _{2} )}{( f ^{'} ( X ) + γ _{1} ) ( t ^{'} ( X ) + γ _{2} )}$

$L_{0} (X) \cdot (z (X) - 1) = 0, \forall x \in H$

下面重新整理下这个协议

协议框架

公共输入：表格向量 $t$ ；

秘密输入：查询向量 $f$ ；

预处理：Prover 和 Verifier 构造 $t (X)$ ，

第一步：Prover 构造多项式并发送承诺 $[f (X)]$ ， $[f^{'} (X)]$ ， $[t^{'} (X)]$

第二步：Verifier 发送挑战数 $γ_{1}$ 与 $γ_{2}$ ，

第三步：Prover 构造多项式并发送承诺 $[z (X)]$

$z (X) = L_{0} (X) + i = 1 \sum N - 1 (L_{i} (X) \cdot j = 0 \prod i - 1 \frac{( f _{i} + γ _{1} ) ( t _{i} + γ _{2} )}{( f _{i}^{'} + γ _{1} ) ( t _{i}^{'} + γ _{2} )})$

第四步：Verififer 发送挑战数 $α$

第五步：Prover 计算并发送商多项式 $[q (X)]$

$q (X) = \frac{1}{v _{H} ( X )} (f^{'} (X) - f^{'} (ω^{- 1} \cdot X)) \cdot (f^{'} (X) - t^{'} (X)) + α \cdot (L_{0} (X) \cdot (f^{'} (X) - t^{'} (X))) + α^{2} \cdot (L_{0} (X) \cdot (z (X) - 1)) + α^{3} \cdot (z (ω \cdot X) \cdot (f^{'} (X) + γ_{1}) (t^{'} (X) + γ_{2}) - z (X) \cdot (f (X) + γ_{1}) (t (X) + γ_{2}))$

第六步：Verifier 发送挑战数 $ζ$

第七步：Prover 发送 $f (ζ), f^{'} (ζ), f^{'} (ω^{- 1} \cdot ζ), t^{'} (ζ), z (ζ), z (ω \cdot ζ), q (ζ)$ ，并附带上 evaluation proofs（略去）

第八步：Verifier 验证（注意这里为了简化，去掉了KZG10的聚合优化和线性化优化）

$q (ζ) \cdot v_{H} (ζ) = ? (f^{'} (ζ) - f^{'} (ω^{- 1} \cdot ζ)) \cdot (f^{'} (ζ) - t^{'} (ζ)) + α \cdot (L_{0} (ζ) \cdot (f^{'} (ζ) - t^{'} (X))) + α^{2} \cdot (L_{0} (ζ) \cdot (z (ζ) - 1)) + α^{3} \cdot (z (ω \cdot ζ) \cdot (f^{'} (ζ) + γ_{1}) (t^{'} (ζ) + γ_{2}) - z (ζ) \cdot (f (ζ) + γ_{1}) (t (ζ) + γ_{2}))$

Plookup 方案

然后我们再看看论文 GW20 给出的方案 —— Plookup。与 Halo2-lookup 相比，Plookup 可以省去 $t^{'}$ 向量。

重申一下 Plookup 证明的场景：Verifier 已知表格 $t$ 向量，Prover 拥有一个秘密的查询向量 $f$ ，Prover 要证明 $f$ 中的每一个元素都在 $t$ 中，即 ${f_{i}} \subseteq_{se t} {t_{i}}$ 。

方案 Plookup 只需要引入一个辅助向量 $s$ ，它被定义为 ${f_{i}} \cup {t_{i}}$ 上的重排，且向量元素的排列遵照 $t$ 中各个元素出现的顺序。

举例说明，假设 $N = 4$ ，如果 $t = (1, 2, 3, 4)$ ， $f = (3, 2, 2, 1)$ ，那么 $s = (1, 1, 2, 2, 2, 3, 3, 4)$ 。可以看到，和 Halo2-lookup 中的 $f^{'}$ 一样， $s$ 中相等的元素被排在了一起。

如果向量 $s$ 满足 ${s_{i}} \subseteq_{se t} {t_{i}}$ ，并且 ${f_{i}} \cup {t_{i}} =_{m u lt i se t} {s_{i}}$ ，那么就可以证明 ${f_{i}} \subseteq_{se t} {t_{i}}$ 。

第一个关键点是因为 $f$ 中的查询记录是任意的，查询顺序并没有遵守 $t$ 中的元素顺序。而通过辅助向量 $s$ ，我们就可以把 $f$ 的查询记录进行重新排序，这有利于排查 $f$ 中元素的合法性，确保每一个 $f_{i}$ 都出现在 $t$ 中。但如何保证由 Prover 构造的 $s$ 是按照 $t$ 的元素顺序进行排序的？Plookup 用了一个直接但巧妙的方法，考虑把 $s$ 中的每一个元素和他相邻下一个元素绑在一起，然后可以构成一个新的 Multiset；同样，我们把 $t$ 中的每一个元素与相邻下一个元素组成一个元组，并构成一个 Multiset；我们还要把 $f$ 中的每一个元素和它自身构成一个二元组 Multiset。我们用 $S = {(s_{i}, s_{i + 1})}$ ， $T = {(t_{i}, t_{i + 1})}$ ， $F = {(f_{i}, f_{i})}$ 来表示这三个新的 Multiset，并证明它们满足一定的关系，从而保证 $s$ 排序的正确性。

$S {(s_{i}, s_{i + 1})} =_{m u lt i se t} T {(t_{i}, t_{i + 1})} \cup F {(f_{i}, f_{i})}$

这个方法与 Permutation Argument 的基本思想非常类似。回忆下，我们在 Permutation Argument 中，利用了 ${(a_{i}, i)}$ 绑定元素和其位置的「二元组」的 Multiset 来保证任一个 $a_{i}$ 都会出现在位置 $i$ 上；通过与另一个二元组 Multiset ${(b_{i}, σ (i)}$ 的相等，可以证明 $a$ 与 $b$ 满足置换函数 $σ$ 。比如下面这个置换函数为奇偶互换的例子：

${(a_{0}, 0), (a_{1}, 1), (a_{2}, 2), (a_{3}, 3)} =_{m u lt i se t} {(b_{0}, 1), (b_{1}, 0), (b_{2}, 3), (b_{3}, 2)}$

假设两个向量 $(a_{0}, a_{1}, a_{2}, a_{3})$ 与 $(b_{0}, b_{1}, b_{2}, b_{3})$ ，如果它们满足上面的 Multiset 相等关系，我们可以知 $a_{0} = b_{1}$ ， $a_{1} = b_{0}$ ， $a_{2} = b_{3}$ ， $a_{3} = b_{2}$ ，满足奇偶互换的关系。

另一个关键点是如何保证 $f$ 中的元素都在 $t$ 中出现？这个问题被归结到一个新问题，即 $s$ 中那些相邻的重复元素一定来自于 $f$ ，假如 $f$ 中有 $l$ 个重复元素，那么我们可以要求其中第一个来自于 $t$ ，剩下的 $l - 1$ 个元素来自于 $f$ 。如果 $f$ 中一旦出现了一个不在 $t$ 中的元素（假设为 $f^{*}$ ），那么因为 $s$ 是 $(f, t)$ 的重排，那么 $s$ 中一定会出现 $f^{*}$ （假设 $f^{*} = s_{i}$ ），这时在 $S$ 中一定会出现 $(s_{i - 1}, f^{*}), (f^{*}, s_{i + 1})$ 这样两个元素，它们无法出现在 ${(t_{j}, t_{j + 1})}$ 这个 Multiset中，也不会出现在 $F$ 中。

举几个例子，假设 $f$ 的长度为 $0$ ，如果 ${(s_{i}, s_{i + 1})} = {(t_{i}, t_{i + 1})}$ ，那么 $s$ 与 $t$ 向量在各个位置上都相等。

假设增加一条查询记录，即 $f = (1)$ ，那么 $T = {(1, 2), (2, 3), (3, 4), (4, 1)}$ ， $F = {(1, 1)}$ ，这时候 $S$ 只有唯一的表达， $S = {(1, 1), (1, 2), (2, 3), (3, 4), (4, 1)}$ ， $S =_{m u lt i se t} T \cup F$ 。

假设 $f = (9)$ ， $9$ 为不出现在 $t$ 中的元素，那么 $F = {(9, 9)}$ 一定没有办法塞入到 S 中，因为在 $s$ 中，和 $9$ 相邻的元素 $s_{k - 1}, s_{k + 1} \neq = 9$ 。因此 $S \neq =_{m u lt i se t} T \cup F$ 。

假设 $f = (2, 2)$ ，那么 $S$ 也只有唯一的表达， $S = {(1, 2), (2, 2), (2, 2), (2, 3), (3, 4), (4, 1)}$ ，同样可以检验： $S =_{m u lt i se t} T \cup F$ 。

更形式化一些，我们可以用数学归纳法推导：先从 $f$ 为空开始推理， $F_{0} = \emptyset$ 。这样我们只要检查 $S_{0} = {(s_{i}, s_{i + 1})}$ 和 $T = {(t_{i}, t_{i + 1})}$ 满足 Multiset 意义上的相等，就可以满足 $S_{0} =_{m u lt i se t} T \cup F_{0}$ ，且 ${f_{i}} \subseteq {t_{i}}$ 。

现在看归纳步，假设 $S_{k} =_{m u lt i se t} T \cup F_{k}$ ，如果我们在 $f$ 中添加一个新元素 $f_{k + 1}$ ，且 $f_{k + 1} = t_{l}$ ，那么在 $S_{k + 1}$ 中会比 $S_{k}$ 额外多一个元素 $(f_{k + 1}, f_{k + 1})$ 。因为 $f_{k + 1} \in {t_{i}}$ ，那么重排向量 $s_{k + 1}$ 中一定包含了相邻的两个 $t_{k + 1}$ ，其中一个来自 $t_{l}$ ，另一个来自于 $f_{k + 1}$ 。因此，我们可以得出结论： $S_{k + 1} = T \cup F_{k} \cup {(t_{k}, t_{k})}$ 。

另一种情况，假设 $S_{k} =_{m u lt i se t} T \cup F_{k}$ ，如果我们在 $f$ 添加的新元素 $f_{k + 1} \neq \in t$ ，即是一条违法查询，假设为 $u$ 。那么 $s$ 中存在与 $u$ 相邻的两个元素， $s_{l - 1}, s_{l + 1}$ ，即 $s = (\dots, s_{l - 1}, u, s_{l + 1}, \dots)$ 。它们构成了 $S$ 中的两个异类元素 $(s_{l - 1}, u), (u, s_{l + 1})$ ，导致 $S_{k + 1} \neq = T \cup F_{k} \cup {(u, u)}$ 。

到此为止，我们已经可以确信，通过验证 $S = T \cup F$ 相等就可以判定 $s$ 是正确的重排，并且 $f$ 中的每一个元素都出现在 $t$ 中。接下来我们把这个问题转换成多项式之间的约束关系。

首先 Prover 借助 Verifier 提供的挑战数 $β$ ，把 $S, T, F$ 中的每一个二元组元素进行「折叠」，转换成单值。这样新约束等式为：

${s_{i} + β s_{i + 1}} = {t_{i} + β t_{i + 1}} \cup {(1 + β) f_{i}}$

然后 Prover 再借助 Verifier 提供的一个挑战数 $γ$ ，把上面的 Multiset Equality Argument 归结到 Grand Product Argument：

$= i \prod ((1 + β) f_{i} + γ) (t_{i} + β \cdot t_{i + 1} + γ) i \prod (s_{i} + β \cdot s_{i + 1} + γ)$

不过这里请注意的是，在 Plookup 论文方案中，并没有采用上面的证明转换形式。而是调换了 $β$ 和 $γ$ 的使用顺序：

${(s_{i} + γ) + β (s_{i + 1} + γ)} = {(t_{i} + γ) + β (t_{i + 1} + γ)} \cup {(f_{i} + γ) + β (f_{i} + γ)}$

归结后的 Grand Product 约束等式为：

$= i \prod (1 + β) (f_{i} + γ) (t_{i} + β \cdot t_{i + 1} + (1 + β) γ) i \prod (s_{i} + β \cdot s_{i + 1} + (1 + β) γ)$

注：个人认为，上述两种证明转换形式没有本质上的区别。为了方便理解论文，我们后文遵从 Plookup 原论文的方式。

接下来，我们要对向量进行多项式编码，但是这里会遇到一个新问题。即 $s$ 多项式的次数会超出 $f$ 的次数或 $t$ 的次数，特别当 $f$ 或 $t$ 的长度接近或者等于 $H$ 的大小， $s$ 的次数可能超出 $H$ 的大小。Plookup 的解决方式是将 $s$ 拆成两半， $s^{l o}$ 与 $s^{hi}$ ，但是 $s^{l o}$ 的最后一个元素要等于 $s^{hi}$ 的第一个元素：

$s_{N - 1}^{l o} = s_{0}^{hi}$

这样做的目的是，确保能在两个向量中描述 $s$ 中相邻两个元素的绑定关系。比如 $s = (1, 2, 2, 3, 4, 4, 4)$ ，那么 $s^{l o} = (1, 2, 2, \underline{3})$ ，而 $s^{hi} = (\underline{3}, 4, 4, 4)$ ，可以看出他们头尾相接。

这样一来， $s$ 的长度最长也只能是 $2 N - 1$ ，但如果 $f$ 与 $t$ 要按照 $2^{k}$ 对齐，那么 $s$ 的长度就不够了（无法在长度为 $N$ 的乘法子群上编码成多项式）。为了解决这个问题，Plookup 选择把 $f$ 的有效长度限制在 $N - 1$ ，所谓有效长度是指， $f$ 的实际长度为 $N$ ，但是其最后一条查询记录并不考虑其合法性。

于是 $s$ 向量可以拆成两个长度为 $N$ 的向量，其中一半 $s^{l o} = (s_{0}, s_{1}, \dots, s_{N - 1})$ ，另一半 $s^{hi} = (s_{N - 1}, s_{N}, \dots, s_{2 N - 2})$

接下来 Prover 要引入 Accumulator 辅助向量 $z$ 来证明 Grand Product：

$z_{0} = 1, z_{i + 1} = z_{i} \cdot \frac{( 1 + β ) ( f _{i} + γ ) ( t _{i} + β \cdot t _{i + 1} + γ ( 1 + β ))}{( s _{i}^{l o} + β \cdot s _{i + 1}^{l o} + γ ( 1 + β )) ( s _{i}^{hi} + β \cdot s _{i + 1}^{hi} + γ ( 1 + β ))}, z_{N - 1} = 1$

我们仍然看下这样一个例子： $t = (1, 2, 3, 4)$ ， $f = (2, 4, 4)$ ，于是 $s = (1, 2, 2, 3, 4, 4, 4)$ ，拆成两个头尾相接的向量： $s^{l o} = (1, 2, 2, 3)$ ， $s^{hi} = (3, 4, 4, 4)$ 。那么，我们可以把相邻元素构成的二元组向量写出来：

\begin{split} F &= (f_i, f_i) & = & {(2,2), (4,4), (4,4)}\ T &=(t_i, t_i) & = & {(1,2), (2,3), (3,4)}\ S^{lo} &= (s^{lo}_i, s^{lo}_i) & = & {(1,2), (2,2), (2,3)}\ S^{hi} &= (s^{hi}_i, s^{hi}_i) & = & {(3,4), (4,4), (4,4)}\ \end{split}

容易检验，他们满足下面的关系：

$S^{l o} \cup S^{hi} =_{m u lt i se t} F \cup T$

于是，利用一个辅助函数 $G (a, b) = a + β \cdot b + γ \cdot (1 + β)$ ，我们定义 $z$ ：

$z_{0} z_{1} z_{2} z_{3} = 1 = \frac{G ( 2 , 2 ) \cdot G ( 1 , 2 )}{G ( 1 , 2 ) \cdot G ( 3 , 4 )} = \frac{G ( 2 , 2 ) \cdot G ( 1 , 2 ) \cdot G ( 4 , 4 ) \cdot G ( 2 , 3 )}{G ( 1 , 2 ) \cdot G ( 3 , 4 ) \cdot G ( 2 , 2 ) \cdot G ( 4 , 4 )} = \frac{G ( 2 , 2 ) \cdot G ( 1 , 2 ) \cdot G ( 4 , 4 ) \cdot G ( 2 , 3 ) \cdot G ( 4 , 4 ) \cdot G ( 3 , 4 )}{G ( 1 , 2 ) \cdot G ( 3 , 4 ) \cdot G ( 2 , 2 ) \cdot G ( 4 , 4 ) \cdot G ( 2 , 3 ) \cdot G ( 4 , 4 )} = 1$

对 $z$ 进行编码，我们可以得到 $z (X)$ 多项式，它应该满足下面三条约束：

$L_{0} (X) \cdot (z (X) - 1) L_{N - 1} (X) \cdot (s^{l o} (X) - s^{hi} (X)) L_{N - 1} (X) \cdot (z (X) - 1) = 0 = 0 = 0$

此外，根据 $z$ 的递推关系， $z (X)$ 还要满足下面的约束：

$(X - ω^{N - 1}) \cdot z (X) \cdot ((1 + β) (f (X) + β)) \cdot (t (X) + β \cdot t (ω \cdot X) + γ (1 + β)) - (X - ω^{N - 1}) \cdot z (ω \cdot X) \cdot (s^{l o} (X) + β \cdot s^{l o} (ω \cdot X) + γ (1 + β)) \cdot (s^{hi} (X) + β \cdot s^{hi} (ω \cdot X) + γ (1 + β)) = 0$

总共有四条多项式约束，这里略去完整的协议。

Plonkup 的优化

在论文 Plonkup 论文中给出了一个简化方法，可以去除一个多项式约束。在 Plookup 方案中， $s$ 向量被拆分成两个向量， $s^{l o}$ 与 $s^{hi}$ ，但要要求这两个向量头尾相接。

Plonkup 给出了一种新的拆分方案，即按照 $s$ 的奇偶项进行拆分，拆成 $s^{e v e n}$ 与 $s^{o dd}$ ：

$s^{e v e n} s^{o dd} = (s_{0}, s_{2}, s_{4}, \dots, s_{2 n - 2}) = (s_{1}, s_{3}, s_{5}, \dots, s_{2 n - 1})$

注意，这里不再需要限制 $f$ 的长度为 $N - 1$ ，而是可以到 $N$ ，这样 $s$ 的长度可以到 $2 N$ ，拆分成两个长度为 $N$ 的向量，之所以可以去除这个限制，是因为 $(f, t, s^{e v e n}, s^{o dd})$ 之间的关系可以在 $H$ 回卷到起始位置，这样只需要要求 $z_{0} = 1$ 即可。 $z$ 向量可以重新定义为：

$z_{0} = 1, z_{i + 1} = z_{i} \cdot \frac{( 1 + β ) ( f _{i} + γ ) ( t _{i} + β \cdot t _{i + 1} + γ ( 1 + β ))}{( s _{i}^{e v e n} + β \cdot s _{i}^{o dd} + γ ( 1 + β )) ( s _{i}^{o dd} + β \cdot s _{i + 1}^{e v e n} + γ ( 1 + β ))}$

我们可以举一个简单的例子：假设 $N = 4$ ， $t = (1, 2, 3, 4)$ ， $f = (2, 4, 4, 1)$ ，于是 $s = (1, 1, 2, 2, 3, 4, 4, 4)$

$s^{e v e n} = (1, 2, 3, 4), s^{o dd} = (1, 2, 4, 4)$

$F T S^{even} S^{odd} = (f_{i}, f_{i}) = {(2, 2), (4, 4), (4, 4), (1, 1)} = (t_{i}, t_{i + 1}) = {(1, 2), (2, 3), (3, 4), (4, 1)} = (s_{i}^{even}, s_{i}^{odd}) = {(1, 1), (2, 2), (3, 4), (4, 4)} = (s_{i}^{odd}, s_{i + 1}^{even}) = {(1, 2), (2, 3), (4, 4), (4, 1)}$

容易检验，他们满足下面的关系：

$S^{e v e n} \cup S^{o dd} =_{m u lt i se t} F \cup T$

我们也可以通过定义 $z$ ，并仔细检查每一项，确认只需要约束 $z_{0} = 1$ 就可以约束 $f$ 与 $s$ 的正确性。

$z_{0} z_{1} z_{2} z_{3} z_{4} = 1 = \frac{G ( 2 , 2 ) \cdot G ( 1 , 2 )}{G ( 1 , 1 ) \cdot G ( 1 , 2 )} = \frac{G ( 2 , 2 ) \cdot G ( 1 , 2 ) \cdot G ( 4 , 4 ) \cdot G ( 2 , 3 )}{G ( 1 , 1 ) \cdot G ( 1 , 2 ) \cdot G ( 2 , 2 ) \cdot G ( 2 , 3 )} = \frac{G ( 2 , 2 ) \cdot G ( 1 , 2 ) \cdot G ( 4 , 4 ) \cdot G ( 2 , 3 ) \cdot G ( 4 , 4 ) \cdot G ( 3 , 4 )}{G ( 1 , 1 ) \cdot G ( 1 , 2 ) \cdot G ( 2 , 2 ) \cdot G ( 2 , 3 ) \cdot G ( 3 , 4 ) \cdot G ( 4 , 4 )} = \frac{G ( 2 , 2 ) \cdot G ( 1 , 2 ) \cdot G ( 4 , 4 ) \cdot G ( 2 , 3 ) \cdot G ( 4 , 4 ) \cdot G ( 3 , 4 ) \cdot G ( 1 , 1 ) \cdot G ( 4 , 1 )}{G ( 1 , 1 ) \cdot G ( 1 , 2 ) \cdot G ( 2 , 2 ) \cdot G ( 2 , 3 ) \cdot G ( 3 , 4 ) \cdot G ( 4 , 4 ) \cdot G ( 4 , 4 ) \cdot G ( 4 , 1 )} = z_{0} = 1$

这里辅助函数 $G (a, b) = a + β \cdot b + γ \cdot (1 + β)$ 。

于是多项式 $z (X)$ 只需要满足如下两条约束：

$L_{0} (X) (z (X) - 1) = 0$

还有

$\frac{z ( ω \cdot X )}{z ( X )} = \frac{( 1 + β ) ( f ( X ) + γ ) ( t ( X ) + β \cdot t ( ω \cdot X ) + γ ( 1 + β ))}{( s ^{e v e n} ( X ) + β \cdot s ^{o dd} ( X ) + γ ( 1 + β )) ( s ^{o dd} ( X ) + β \cdot s ^{e v e n} ( ω \cdot X ) + γ ( 1 + β ))}$

多列表格与多表格扩展

通常查询表是一个多列的表，比如一个 8bit-XOR 计算表是一个三列的表。对于 Plookup 方案与 Halo2-lookup 方案，我们直接可以通过随机挑战数来把一个多列表格折叠成一个单列表格。

假如计算表格为 $(t_{1}, t_{2}, t_{3})$ ，那么相应的查询记录也应该是个三列的表格，记为 $(f_{1}, f_{2}, f_{3})$ 。如果 $(f_{1, i}, f_{2, i}, f_{3, i}) = (t_{1, j}, t_{2, j}, f_{3, j})$ ，对所有的 $i \in [0, N)$ 都成立，那么 $(f_{1}, f_{2}, f_{3})$ 是一个合法的查询记录。通过向 Verifier 要一个随机挑战数 $η$ ，我们可以把计算表格横向折叠起来：

$t = t_{1} + η \cdot t_{2} + η^{2} \cdot t_{3}$

同样，Prover 在证明过程中，也将查询记录横向折叠起来：

$f = f_{1} + η \cdot f_{2} + η^{2} \cdot f_{3}$

接下来，Prover 和 Verifier 可以利用单列表格查询协议（ Plookup 协议或 Halo2-lookup 协议）完成证明过程。

如果存在多张不同的表格，那么可以给这些表格增加公开的一列，用来标记表格编号，这样可以把多表格视为增加一列的多列的单一表格。

与 Plonk 协议的整合

由于计算表格 $t$ 是一个预定义的多列表格，因此它可以在 Preprocessing 阶段进行承诺计算，并把这些表格的承诺作为后续协议交互的公开输入。

在 Plonk 协议中，因为我们把表格的查询视为一种特殊的门，因此查询记录 $f$ 本质上正是 $(w_{a}, w_{b}, w_{c})$ 的折叠。为了区分「查询门」和「算术门」，我们还需要增加一个选择向量 $q_{K}$ ，标记 Witness table 中的某一行是算术门，还是查询门。

下面我们按照 Plonkup 论文中的协议，大概描述下如何将 Lookup Argument 整合进 Plonk 协议。

预处理：Prover 和 Verifier 构造 $[q_{L} (X)]$ ， $[q_{R} (X)]$ ， $[q_{O} (X)]$ ， $[q_{M} (X)]$ ， $[q_{C} (X)]$ ， $[q_{K} (X)]$ ， $[σ_{a} (X)]$ ， $[σ_{b} (X)]$ ， $[σ_{c} (X)]$ ， $[t_{1} (X)]$ ， $[t_{2} (X)]$ ， $[t_{3} (X)]$

第一步：Prover 针对 $W$ 表格的每一列，构造 $[w_{a} (X)]$ ， $[w_{b} (X)]$ ， $[w_{c} (X)]$ ， $ϕ (X)$ 使得

$q_{L} (X) w_{a} (X) + q_{R} (X) w_{b} (X) + q_{M} (X) w_{a} (X) w_{b} (X) - q_{O} (X) w_{c} (X) + q_{C} (X) + ϕ (X) = 0$

第二步：Verifier 发送随机数 $η$ ，用以折叠表格

第三步：Prover 构造并发送 $[f (X)]$ 与 $[t (X)]$ ，分别编码 $f$ 与 $t = t_{1} + η \cdot t_{2} + η^{2} \cdot t_{3}$ ，其中 $f$ 计算如下

$f_{i} = {w_{a, i} + η \cdot w_{b, i} + η^{2} \cdot w_{c, i}, t_{1, N - 1} + η \cdot t_{2, N - 1} + η^{2} \cdot t_{3, N - 1}, if q_{K} (i) = 1 if q_{K} (i) = 0$

这里请注意，当 $q_{K} (ω_{i}) = 0$ 时，表示这一行约束不是查询门，因此需要填充上一个存在 $t$ 中的值，这里我们取表格的最后一个元素作为查询记录填充。

Prover 计算 $s$ ，并拆分为 $s^{e v e n}$ 与 $s^{o dd}$ ，构造并发送 $[s^{e v e n} (X)]$ 与 $[s^{o dd} (X)]$

第四步： Verifier 发送随机数 $(β_{1}, γ_{1})$ 与 $(β_{2}, γ_{2})$

第五步：Prover 构造（并发送）拷贝约束累乘多项式 $[z (X)]$ ，使得

$L_{0} (X) (z (X) - 1) z (ω \cdot X) g_{2} (X) - z (X) g_{1} (X) = 0 = 0$

其中

$g_{1} (X) g_{2} (X) = (w_{a} (X) + β_{1} \cdot i d_{a} (X) + γ_{1}) (w_{b} (X) + β_{1} \cdot i d_{b} (X) + γ_{1}) (w_{c} (X) + β_{1} \cdot i d_{c} (X) + γ_{1}) = (w_{a} (X) + β_{1} \cdot σ_{a} (X) + γ_{1}) (w_{b} (X) + β_{1} \cdot σ_{b} (X) + γ_{1}) (w_{c} (X) + β_{1} \cdot σ_{c} (X) + γ_{1})$

Prover 构造（并发送）查询累乘多项式 $[z^{'} (X)]$ ，使得：

$L_{0} (X) (z^{'} (X) - 1) z^{'} (ω \cdot X) g_{4} (X) - z^{'} (X) g_{3} (X) = 0 = 0$

其中

$g_{3} (X) g_{4} (X) = ((1 + β_{2}) (f (X) + γ_{2})) \cdot (t (X) + β_{2} \cdot t (ω \cdot X) + γ_{2} (1 + β_{2})) = (s^{e v e n} (X) + β_{2} \cdot s^{o dd} (X) + γ_{2} (1 + β_{2})) \cdot (s^{o dd} (X) + β_{2} \cdot s^{e v e n} (ω \cdot X) + γ_{2} (1 + β_{2}))$

第六步：Verifier 发送随机挑战数 $α$

第七步：Prover 计算 $h (X)$ ，并构造商多项式 $[t (X)]$

$t (X) \cdot z_{H} (X) = q_{L} (X) w_{a} (X) + q_{R} (X) w_{b} (X) + q_{M} (X) w_{a} (X) w_{b} (X) - q_{O} (X) w_{c} (X) + q_{C} (X) + ϕ (X) + α (z (ω X) \cdot g_{2} (X) - z (X) \cdot g_{1} (X)) + α^{2} (L_{0} (X) \cdot (z (X) - 1)) + α^{3} (q_{K} (X) \cdot (w_{a} (X) + η w_{b} (X) + η^{2} w_{c} (X) - f (X))) + α^{4} (z^{'} (ω X) \cdot g_{4} (X) - z^{'} (X) \cdot g_{3} (X)) + α^{5} (L_{0} (X) \cdot (z^{'} (X) - 1))$

后续步：Verifier 发送随机挑战数 $ζ$ ，Prover 打开各个多项式，Verifier 自行计算 $z_{H} (ζ)$ 与 $L_{0} (ζ)$ ，并验证各个多项式在 $ζ$ 与 $ω \cdot ζ$ 处的计算证明，并验证这些打开点满足上面等式。

完整的协议请参考Plonkup论文 [2]。

Reference

[1] Ariel Gabizo, Dmitry Khovratovich. flookup: Fractional decomposition-based lookups in quasi-linear time independent of table size. https://eprint.iacr.org/2022/1447.
[2] Luke Pearson, Joshua Fitzgerald, Héctor Masip, Marta Bellés-Muñoz, and Jose Luis Muñoz-Tapia. PlonKup: Reconciling PlonK with plookup. https://eprint.iacr.org/2022/086.
[3] https://zcash.github.io/halo2/design/proving-system/lookup.html
[4] Ariel Gabizon. Multiset checks in PLONK and Plookup. https://hackmd.io/@arielg/ByFgSDA7D
[5] Modified Lookup Argument (improved). https://hackmd.io/_Q8YR_JLTvefW3kK92KOFgv

作者: Yu Guo@Secbit(郭宇): Founder of Secbit, https://github.com/sec-bit

理解 Lasso（零）：带索引的查询证明

作者: Yu Guo@Secbit(郭宇): Founder of Secbit, https://github.com/sec-bit

假设我们有一个公开的表格向量 $t$ ，长度为 $N$ ，和一个查询向量 $f$ ，长度为 $m$ ，我们可以利用 Lookup Argument 来证明下面的 lookup 关系：

$\forall i \in [0, m), f_{i} \in t$

上面这个 Lookup Argument 定义被 Lasso 论文称为 Unindexed Lookup Argument。因为这个定义只保证了 $f_{i}$ 在 $t$ 中，但是并不保证 $f_{i}$ 出现在 $t$ 中某个特定的位置。

假如我们要表示一个 2bit-XOR 运算，需要用到一个三列表格：

$A 0000 ⋮ 11 B 0001 ⋮ 11 A \oplus B 0001 ⋮ 00$

其中第一列表示第一个运算数 $A$ ，第二列表示第二个运算数 $B$ ，第三列表示 XOR 运算结果， $A \oplus B$ 。显然，表格中的行是可以互换位置的，而不影响表格所表达的 XOR 操作。注意到这个表格共有 16 行。

对于这个表格，我们可以看到表格中的任意两行可以交换，而并不影响表格所要表达的语义。因为表格的每一行同时包含了 XOR 运算的输入和输出。

那么我们问，能不能采用一个单列表格来表达这个 XOR 运算？

Indexed Lookup Arguments

其中一个思路是这样的，我们只采用一列表格来表示「XOR 运算的输出」，即 $A \oplus B$ ，而用表格的行索引来代替两个运算的输入（Oprands）。比如，我们在第 0 行放上 $00$ ，因为 $00 = 00 \oplus 00$ ，等号右边为行数的 4bit 编码， $0000$ ，其高位 $00$ 表示 $A$ ，低位 $00$ 表示 $B$ 。

又比如，表格的第 5 行（记住行数从零计数）为 $00$ ，因为 $01 \oplus 01 = 00$ ，而行索引 $5$ 的二进制表示可以按位拆分为两个二进制数 $01$ 和 $01$ ，即 $(0101)_{(2)} = 5_{(10)}$ 。可见，这个单列表格的大小仍然是 16 行。但是与上面的 XOR 表格不同，这个表格的各行是不允许打乱顺序的，下面是单列的 XOR 表格：

$i 01 ⋮ 15 A ∥ B 00 ∥ 00 00 ∥ 01 ⋮ 11 ∥ 11 A \oplus B 0001 ⋮ 00$

单列有序表格的好处是，我们只需要用一个多项式对其编码。此外，Lasso 还进一步探索了单列表格可能具有的内部结构，探索如何把单列的大表格拆分成多个小表格，从而提高证明效率。Jolt 展示了如何利用表格的内部结构，来编码 RISC-V 的完整指令运算。

基于单列有序的表格，Lasso 论文定义了一类新的 Lookup Argument，称之为 Indexed Lookup Argument：

$\forall i \in [0, m), f_{i} = t_{a_{i}}$

其中 $a = (a_{0}, a_{1}, \dots, a_{m - 1})$ 为一组索引值，表示每一个查询 $f_{i}$ 在表格 $t$ 中出现的位置。

对于一个 Indexed Lookup Argument，公共输入为三个向量的承诺：

表格向量的承诺 $cm (t)$
查询向量的承诺 $cm (f)$
索引向量的承诺 $cm (a)$

证明的关系为：

$R_{in d e x e d - l k u p} = {(cm (t), cm (f), cm (a); t, f, a) ∣ \forall i \in [0, m), f_{i} = t_{a_{i}}}$

出现在Plonk 协议中的 Plookup，以及后续的 Caulk/Caulk+，FLookup, Logup，cq 都属于 Unindexed Lookup Arguments。基于 Unindexed Lookup Arguments，我们同样可以构建 Indexed Lookup Argument。常见的有两个方案。

首先，如果 Unindexed Lookup Arguments 支持表格列的加法同态，那么我们可以为表格增加一列，作为 Index 列，然后通过 Verifier 给出一个随机数 $η$ ，然后将 Index 列和原表格列（或多列）做一个 Random Linear Combination 合并为一列。比如一个单列表格为 $t = (t_{0}, t_{1}, \dots, t_{N - 1})$ ，那么我们可以通过 $η$ 构造一个混有 Index 的新表格列：

$t_{I}^{'} = (t_{0}, t_{1} + η, t_{2} + 2 η, \dots, t_{N - 1} + η \cdot (N - 1))$

比如 Plookup，Caulk/Caulk+，Baloo，与 cq 都支持表格承诺的加法同态。但是对于 fLookup 等不支持加法同态的 Lookup Arguments，我们可以找到一个值， $κ > max {t_{i}, i \in [0, N)}$ ，然后通过 $κ$ 把索引列合并到原表格列：

$t_{I}^{''} = (t_{0}, t_{1} + κ, t_{2} + 2 κ, \dots, t_{N - 1} + κ \cdot (N - 1))$

不过，Prover 还要额外证明表格列中的每一项 $t_{i} < κ$ ，这需要 $N$ 个 Range Arguments。

从一个 Indexed Lookup Argument 可以更容易地得到 Unindexed Lookup Argument，只需要把索引向量的承诺从公共输入中移除即可，在协议的开头，Prover 补充发送这个索引承诺即可。

Various Lookup Arguments From the Lasso Paper

本系列文章后续将描述总共四个不同的 Indexed Lookup Arguments 协议：

Lookup Arguments based on Offline Memory Checking
Lookup Arguments based on Spark
Lookup Arguments based on Surge
Lookup Arguments based on Sparse-dense Sumcheck

第一个协议基于经典的 Offline Memory Checking，改进自 Spartan 论文中的 Memory Checking 协议。支持 Indexed Lookup 与 UnIndexed Lookup。通过 Offline Memory Checking，我们将 Lookup 关系归结到一个（只读）内存读取的虚拟机执行关系的合法性。

第二个协议 Spark 源于 Spartan 论文。为了处理查询向量中可能出现的重复表格项，我们引入一个矩阵 $M$ 来作为表格选择器，采用 Matrix-vector Multiplication 公式来证明 Lookup 关系：

$M t = f$

其中 $t$ 为表格，长度为 $n$ ， $f$ 为 lookup 记录，长度为 $m$ 。这个核心公式来自 [Baloo] 论文。

矩阵 $M \in F^{m \times N}$ 充当了选择器的角色。它的每一行都是一个 Unit Vector，即每一个行向量中，只有一个元素为 $1$ ，其余元素均为零。显然矩阵 $M$ 中包含大量的零，如果我们直接用多项式对 $M$ 中的全部元素进行粗暴地编码，那么这相当于对于一个长度为 $O (m \cdot N)$ 的稀疏向量编码，浪费严重。

举个例子，比如 $n = 8, m = 4$ ，查询向量 $f$ 定义为：

$f = (t_{2}, t_{7}, t_{4}, t_{2})$

那么 $M$ 矩阵满足下面的等式：

$00000000100100000010000000000100 t_{0} t_{1} t_{2} t_{3} t_{4} t_{5} t_{6} t_{7} = f_{0} : t_{2} f_{1} : t_{7} f_{2} : t_{4} f_{3} : t_{2}$

如果我们可以利用 $M$ 矩阵的稀疏性，即 $M$ 中仅包含有 $m$ 个非零元素，那么我们可以构造更有效率的 Lookup Argument 方案。[Spartan] 论文提出了针对稀疏矩阵的多项式承诺方案，使得其 Evaluation Argument 的证明时间仅与 $m$ 有关。

Spark 协议的另一个特点是利用了 $\tilde{e q} (X, Y)$ 的 Tensor 结构。如果表格也具有类似的结构，那么意味着被查询的表格可以拆解成多个维度上的短向量，那么也就意味着 Prover 和 Verifier 不再需要处理一个很大的表格（如果表格长度 $N > 2^{64}$ ），而只需要承诺和证明多个短向量（作为子表格）即可。第三个协议 Surge 正是这样一个可以证明某一类支持子表格拆解的 Lookup Argument。

支持巨大的表格，比如 $N = 2^{128}$ ，并不是只有拆解子表格这一种办法，如果表格满足另外一种特性 MLE-Structured，即表格多项式 $t (X)$ 的求值运算时间复杂度为 $O (lo g N)$ ，那么我们可以不需要拆分表格，也不需要让 Prover 承诺表格（表格太大，承诺的计算也无法完成），而是在协议中以「惰性计算」的方式（Lazy On-demand）来临时计算表格的每一项（以表格项的 Index 作为输入，计算表格项 $t (i)$ ）。这是最后一个 Lookup Argument 的核心思想，被称为 Generalized Lasso。

Generalized Lasso 利用一个所谓的 Sparse-dense Sumcheck 协议来利用查询向量（关于表格向量）的稀疏性，使 Prover 在证明过程中「惰性计算」 $t$ 中那些仅被查询到的表格项，这样就做到了证明时间复杂度只与查询的数量有关，而与表格长度无关。并且与 cq 等协议相比，Generalized Lasso 并不需要昂贵的预处理。当然，Generalized Lasso 仅能处理满足 MLE-Structured 的一类表格，而非是一个通用的 Lookup Argument。

总结下，Lasso 论文把 Lasso 可以处理的表格分为三类。

Unstructured but small
Decomposable
Non-decomposable but MLE-structured

References

[Lasso] Unlocking the lookup singularity with Lasso by Srinath Setty, Justin Thaler and Riad Wahby.
[Jolt] Jolt: SNARKs for Virtual Machines via Lookups by Arasu Arun, Srinath Setty and Justin Thaler.
[PLONK] PLONK: Permutations over Lagrange-bases for Oecumenical Noninteractive arguments of Knowledge by Ariel Gabizon, Zachary J. Williamson and Oana Ciobotaru.
[Plookup] plookup: A simplified polynomial protocol for lookup tables by Ariel Gabizon and Zachary J. Williamson.
[Caulk] Caulk: Lookup Arguments in Sublinear Time by Arantxa Zapico, Vitalik Buterin,Dmitry Khovratovich, Mary Maller, Anca Nitulescu and Mark Simkin
[Caulk+] Caulk+: Table-independent lookup arguments by Jim Posen and Assimakis A. Kattis.
[Baloo] Baloo: Nearly Optimal Lookup Arguments by Arantxa Zapico, Ariel Gabizon, Dmitry Khovratovich, Mary Maller and Carla Ràfols.
[CQ] cq: Cached quotients for fast lookups by Liam Eagen, Dario Fiore and Ariel Gabizon.

理解 Lasso（一）：Offline Memory Checking

作者: Yu Guo@Secbit(郭宇): Founder of Secbit, https://github.com/sec-bit

假设我们有一个公开的 Table 向量 $t$ （长度为 $n$ ），和一个 Lookup 向量 $f$ （长度为 $m$ ），此外还有一个索引向量 $a$ （长度为 $m$ ），如何证明下面的 Indexed Lookup 关系？

$\forall i \in [0, m), f_{i} = t_{a_{i}}$

虽然我们有 Plookup, Caulk/Caulk+, Baloo, Logup，cq 等等方案可以直接使用，但 Offline memory checking 提供了一个更直观的新视角来看待 Lookup Argument。

1. Memory-in-the-head

我们把 Lookup 的过程看成是一个虚拟机读取内存的过程。如果一个 Lookup 关系成立，那么我们一定可以构造出一个合法的虚拟机执行序列，这个序列中的每一步都是合法的内存读取操作，从而证明每一个执行步读取的值 $f_{i}$ 都是出自只读内存 $mem$ ，即证明了 Lookup 关系。如果我们关心内存读取的地址的话，那么我们就实现了一个 Indexed Lookup Argument。对于一个 Prover，她可以在本地构造虚拟机的执行序列 $T$ ，并向 Verifier 证明 $T$ 的合法性。而对于 Verifier 而言，我们比较关心 Verifier 如何在不需要遍历 $T$ 的情况下，验证这个长度为 $m$ 的执行序列。因此，一个 Lookup 关系的证明，就转化为一段「只读内存」读取日志的正确性证明。换句话说，如果一串内存读取过程是正确的（符合虚拟机运行规则，并可以复现），那么就能推出这样的结论：如果每次读取的内容都是合理的，那么读取的值一定存在于原始内存（表格）中。这种证明思路可以形象地被称为「Memory in the head」，Prover 向 Verifier 证明一个头脑中想象出来的内存的读写合法性。

下面是一个虚拟机执行序列的例子，也是一个确定性状态转移关系：

$S_{0} \to T_{0} S_{1} \to T_{1} S_{2} \to T_{2} \dots \to T_{m - 1} S_{m}$

其中 $(T_{0}, T_{1}, \dots, T_{m - 1})$ 代表内存读取操作，按顺序读出来 $(f_{0}, f_{1}, \dots, f_{m - 1})$ 。虚拟机内存状态 $S$ 是一个三元组 $(i, v, c)$ 的集合，一个三元组包含内存地址 $i$ ，内容 $v$ 和计数器 $c$ 三部分。注意到我们为每一个内存单元都附加一个计数器，标记着这个内存单元被读取的次数，这个计数器的作用是确保只读内存在读取过程中仍然会发生实质性的状态更新，从而提供了执行步 $T_{i}$ 的验证信息。

内存初始状态 $S_{0}$ 中的元素如下：

$S_{0} = addr. 012 ⋮ n - 1 value t_{0} t_{1} t_{2} ⋮ t_{n - 1} counter 000 ⋮ 0$

由于每一次内存的读取（虚拟机的执行）都会修改相应地址上的计数器，让计数器加一，因此我们规定虚拟机在每一次读写内存的前后，必须抛出两个日志（或者理解为事件），内存读取日志 $R$ 与内存更新日志 $W$ 。两者也同样都是一个三元组 $(i, v, c)$ ，包含内存读取地址 $i$ ，读取内容 $v$ ，和计数器的值 $c$ 。

$R W = (i, v, c) = (i, v, c)$

对于内存读取日志 $R$ 中的 $c$ 为读取时刻内存单元 $i$ 中的计数器值； $W$ 中的 $c$ 为更新后的计数器值。换句话说，我们也可以理解 $R$ 发生在一次内存读取之前, $W$ 发生在一次内存读取后，两个事件之前内存单元因为一次「读取」而将计数器的值加一。这一前一后两个日志的作用是约束每一次内存读取的合法性。怎么做到的呢？我们先看一个例子，假如内存的长度为 4，存放的内容为 $[t_{0}, t_{1}, t_{2}, t_{3}]$ ，假如我们要依次从内存中读取 $[t_{1}, t_{3}, t_{1}]$ ，那么会产生下面的日志序列

$R_{1} W_{1} R_{2} W_{2} R_{3} W_{3} = (1, t_{1}, 0) = (1, t_{1}, 1) = (3, t_{3}, 0) = (3, t_{3}, 1) = (1, t_{1}, 1) = (1, t_{1}, 2)$

三次读取产生的状态转移如下：

$S_{0} : 0, 1, 2, 3, t_{0}, t_{1}, t_{2}, t_{3}, 0000 ⟼ S_{1} : 0, 1, 2, 3, t_{0}, t_{1}, t_{2}, t_{3}, 0100 ⟼ S_{2} : 0, 1, 2, 3, t_{0}, t_{1}, t_{2}, t_{3}, 0101 ⟼ S_{3} : 0, 1, 2, 3, t_{0}, t_{1}, t_{2}, t_{3}, 0201$

2. 内存读取的验证

现在思考下，一个 Prover 如何向 Verifier 证明虚拟机执行序列的合法性？下面我们给出虚拟机执行合法性的四个条件：

$Cond1: Cond2: Cond3: Cond4: S_{0} . v = t and S_{0} . c = 0 \exists S_{n}, S_{0} ⟼^{*} S_{n} and S_{0} . v = S_{n} . v \forall W_{j} = (i, v, c), \exists R_{j} = (i, v^{'}, c^{'}), v = v^{'} and c = c^{'} + 1 \forall R_{j} = (i, v, c), if c = 0, R_{j} = S_{0} [i] if c > 0, \exists k > 0, \exists W_{j - k}, W_{j - k} = R_{j}$

解读如下：

条件(1)：虚拟机执行必须从一个初始状态 $S_{0}$ 开始，即内存中依次存放着表格内容 $t$ ，并且计数器都置为零；
条件(2)：存在一个正确的终状态 $S_{n}$ ，并且 $S_{n}$ 中的内存数据 $t$ 没有被修改；
条件(3)：对于每一个 $W_{j}$ 日志，在「该事件之前」都会有一个成对出现的 $R_{j}$ 日志，他们记录的读取值相等 $W_{j} . v = R_{j} . v$ ，但 $W_{j} . c = R_{j} . c + 1$ ；
条件(4)：对于每一个 $R_{j}$ ，如果它是地址 $i$ 上的第一次读取，读取值应该等于内存初始状态 $R_{j} . v = S_{0} [i] . v$ ；如果它是地址 $i$ 上的第二次或后续读取，那么在「该事件之前」一定有一个对应的 $W_{j - k}$ 日志，使得 $R_{j} = W_{j - k}$ 。

这四个条件是否完备充分呢？我们可以试着用归谬法推理下：

假如存在有一个 $R_{j}^{*} = (a^{*}, v^{*}, c^{*})$ 中的读取数值 $v^{*}$ 非法，即 $v^{*} \neq \in t$ ，并且此刻计数器为 $c^{*}$ 。

假如 $c^{*} = 0$ ，那么根据条件 (4)， $t^{*} = S_{0} [i^{*}] . v$ ，又因为条件 (1)， $S_{0} (i^{*}) . v = t_{i^{*}} \in t$ ，这与假设矛盾。

另一种情况是 $c^{*} > 0$ ，那么根据条件 (4)，一定存在一个 $W_{j - k} (i^{*}, v^{*}, c^{*})$ 日志，使得 $W_{j - k}$ 的计数器值为 $c^{*}$ ，再根据条件 (3)，一定存在一个 $R_{j - k}$ 日志，使得 $R_{j - k} (i^{*}, v^{*}, c^{*} - 1)$ 。以此递归地推理下去，每次 $c^{*}$ 递减一，最后我们一定可以得到某个 $R_{j - k - l} = (i^{*}, v^{*}, 0)$ ，于是根据条件 (1) 可得， $S_{0} = (i^{*}, v^{*}, 0)$ ，这与条件（1） $S_{0}$ 的正确性（ $v^{*} \in t$ ）矛盾。

到此推理完毕，存在有一个非法读取日志 $R_{j}^{*}$ 的假设不正确，因此我们得出结论：满足上面四个条件的虚拟机执行序列中，不可能出现读取一个错误的值的情况。

因此，只要 Prover 能够证明，(1) 初始状态 $S_{0}$ 正确，并且 (2) 每一步读取日志是自洽的，那么我们可以证明读取过程就是不可伪造的。Offline Memory Checking 提供了一个漂亮的约束等式，同时满足上面四个条件：

$S_{0} \cup {W_{j}}_{j = 0}^{m - 1} = S_{n} \cup {R_{j}}_{j = 0}^{m - 1}$

我们进一步分析下这个约束等式，先展开下等式左右两边的定义：

$S_{0} = {(i, t_{i}, 0)}_{i \in [n]} \cup W = {(a_{j}, f_{j}, c_{j} + 1)}_{j \in [m]} = S_{n} = {(i, t_{i}, c_{i}^{'})}_{i \in [n]} \cup R = {(a_{j}, f_{j}, c_{j})}_{j \in [m]}$

这个等式约束是关于四个多重集合（Multiset）之间的关系。容易看出，初始状态约束 条件(1) 和终状态约束 条件(2) 已体现在上面的等式中。接下来我们简单分析下，上面这个等式如何保证了 条件(3) 和 条件(4)。

先看下条件(3)，对于每一个 $W_{j}$ （出现在等式左侧），那么就有一个成对出现的 $R_{j}$ （出现在等式右侧），两个日志的差别是右侧 $R_{j}$ 的计数器值少一。看下 条件(4)，如果某个 $R_{j}$ 中的计数器值为零，那么在等式左边一定有一个相同的三元组元素，出现在 $S_{0}$ 集合中；如果 $R_{j}$ 中的某个元素的计数器值大于零，那么这个元素一定出现在等式左边的 $R_{j}$ 中。

注意到，等式右边来自于 $S_{n}$ 中的每一个元素，可能出现在左边的 $S_{0}$ 中，这意味着该元素所对应的内存单元从未被读取过； $S_{n}$ 集合元素也可能出现在 $W$ 中，这意味着该元素的计数器值等于最后一次内存单元计数器的更新值。

最后我们分析下 Prover 和 Verifier 的输入。对于 Verifier 而言， $S_{0}$ 属于 Public inputs，这样 Verifier 可以验证 条件(1)，Verifier 要求 Prover 提供 $c^{'}$ 向量，从而构造 $S_{n}$ ，验证 条件(2)。此外 Public inputs 还要包括承诺 $cm (a)$ ， $cm (t)$ 和 $cm (f)$ ，以便 Verifier 同态地验证 Multiset 等价关系。而日志集合 ${R_{j}}, {W_{j}}$ 由 Prover 构造，并给出其中计数器部分的承诺 $cm (c)$ ，从而允许 Verifier 来验证正确性条件 (3)。而 Verifier 也可以根据 $cm (a)$ ， $cm (t)$ 和 $cm (f)$ 还有 $cm (c)$ ，同态地构造出 ${R_{j}}, {W_{j}}$ 的承诺。

接下来我们利用 Memory-in-the-head 的思路，设计一个 PIOP 协议，实现 Indexed Lookup Argument。

3. 构造 Lookup Argument 协议

我们把这四个集合 $S_{0}, {R_{j}}, {W_{j}}, S_{n}$ 看成是三列矩阵，并且所有的矩阵列向量都编码为多项式。其中 $S_{0}$ 矩阵的三列记为 $S_{i} (X)$ , $t (X)$ 与 $S_{c} (X)$ ，这里注意在 $S_{0}$ 中的 value 一列必须等于表格向量 $t$ 。矩阵 $S_{n}$ 为虚拟机的终止状态，由于虚拟机内存为只读内存，因此 $a dd r .$ 和 $v a l u e$ 两列保持不变，但是内存单元计数器被更新到了 $c^{'}$ ，编码为 $S_{c}^{'} (X)$ ，多项式编码的 Domain 记为 $H \subset F$ 。

$S_{0} = addr. 012 ⋮ n - 1 S_{i} (X) value t_{0} t_{1} t_{2} ⋮ t_{n - 1} t (X) counter 000 ⋮ 0 S_{c} (X) S_{n} = addr. 012 ⋮ n - 1 S_{i} (X) value t_{0} t_{1} t_{2} ⋮ t_{n - 1} t (X) counter c_{0}^{'} c_{1}^{'} c_{2}^{'} ⋮ c_{n - 1}^{'} S_{c}^{'} (X) R = addr. a_{0} a_{1} a_{2} ⋮ a - 1 a (X) value f_{0} f_{1} f_{2} ⋮ f_{m - 1} f (X) counter c_{0} c_{1} c_{2} ⋮ c_{m - 1} R_{c} (X) W = addr. a_{0} a_{1} a_{2} ⋮ a - 1 a (X) value f_{0} f_{1} f_{2} ⋮ f_{m - 1} f (X) counter c_{0} + 1 c_{1} + 1 c_{2} + 1 ⋮ c_{m - 1} + 1 W_{c} (X)$

日志矩阵 $R$ 的第一列为读取的地址序列，它必须等于地址向量 $a$ ，第二列为读取的值，等于 $f$ ，而第三列 $c$ 为 Prover 维护的计数器向量，编码为 $R_{c} (X)$ 。再看下矩阵 $W$ ，其每一行为一条内存更新日志，其中第三列为更新后的计数器值，这个值编码为 $W_{c} (X)$ ，并应该满足下面的约束：

$W_{c} (X) = R_{c} (X) + 1$

下面是 Offline Memory Checking 的约束等式：

$S_{0} ({(i, t_{i}, 0)}_{i \in [n]}) \cup W {(a_{j}, f_{j}, c_{j} + 1)}_{j \in [m]} = S_{n} {(i, t_{i}, c_{i}^{'})}_{i \in [n]} \cup R {(a_{j}, f_{j}, c_{j})}_{j \in [m]}$

我们可以用多项式之间的约束关系描述下 Multiset 等价约束：

$S_{0} (Y, Z) \cdot W (Y, Z) = S_{n} (Y, Z) \cdot R (Y, Z)$

其中四个二元多项式的定义如下：

$S_{0} (Y, Z) S_{n} (Y, Z) R (Y, Z) W (Y, Z) = X \in H \prod (S_{i} (X) + t (X) \cdot Y + S_{c} (X) \cdot Y^{2} - Z) = X \in H \prod (S_{i} (X) + t (X) \cdot Y + S_{c}^{'} (X) \cdot Y^{2} - Z) = X \in H \prod (a (X) + f (X) \cdot Y + R_{c} (X) \cdot Y^{2} - Z) = X \in H \prod (a (X) + f (X) \cdot Y + W_{c} (X) \cdot Y^{2} - Z)$

其中 $W_{c} (X) = R_{c} (X) + 1$ 。

我们可以再使用两个 Verifier 提供的随机挑战数 $Y = β$ 与 $Z = γ$ ，把上面的多项式等价关系归结到两个 Grand Product 之间的等价关系。而 Grand Product Argument，我们可以有多种方案来完成。例如我们可以采用 Plonk 协议中的 Grand Product 子协议来完成，也可以采用 GKR 协议，或者论文 [Quarks, SL20] 中基于 Sumcheck 的协议。

协议描述

公共输入：

$C_{t} = cm (t)$ ， $∣ t ∣ = n$
$C_{f} = cm (f)$ ， $∣ f ∣ = m$
$C_{a} = cm (a)$ ， $∣ a ∣ = m$

第一轮

Prover 模拟内存读取流程得到终状态 $S_{m} = {(i, t_{i}, c_{i}^{final})}_{i \in [m]}$ ，得到 ${R_{j}}_{j \in [m]}$ ， ${W_{j}}_{j \in [m]}$

$R_{j} W_{j} = {(a_{j}, f_{j}, c_{j})}, j \in [m] = {(a_{j}, f_{j}, c_{j} + 1)}, j \in [m]$

Prover 计算 ${c_{j}}_{j \in [m]}$ 的承诺 $C_{c} = cm ({c_{j}})$ ， Prover 计算 ${c_{i}^{final}}_{i \in [n]}$ 的承诺 $C_{c}^{final}$

Prover 发送 $(C_{c}, C_{c}^{final})$

第二轮

Verifier 发送挑战数 $β, γ$

Prover 计算读取/更新日志向量 $R (X)$ , $W (X)$ ,

$R_{j} W_{j} = a_{j} + β \cdot f_{j} + β^{2} \cdot c_{j} - γ = a_{j} + β \cdot f_{j} + β^{2} \cdot (c_{j} + 1) - γ$

Prover 计算 $S^{init} (X)$ 与 $S^{final} (X)$

$S_{i}^{init} S_{i}^{final} = i + β \cdot t_{i} + β^{2} \cdot 0 - γ = i + β \cdot t_{i} + β^{2} \cdot c_{i}^{final} - γ$

Prover 和 Verifier 利用 Grand Product Argument 来证明下面的等式：

$(i = 0 \prod n - 1 S_{i}^{init}) \cdot (j = 0 \prod m - 1 R_{j}) = (i = 0 \prod n - 1 S_{i}^{final}) \cdot (j = 0 \prod m - 1 W_{j})$

验证

Verifier 计算 $C_{R}, C_{W}, C_{S}^{init}, C_{S}^{final}$ ，并验证 Grand Product Argument

$C_{S}^{init} = C_{I} + β \cdot C_{t} - γ \cdot [1] C_{R} = C_{a} + β \cdot C_{f} + β^{2} \cdot C_{c} - γ \cdot [1] C_{W} = C_{a} + β \cdot C_{f} + β^{2} \cdot (C_{c} + [1]) - γ \cdot [1] C_{S}^{final} = C_{I} + β \cdot C_{t} + β^{2} \cdot C_{c}^{final} - γ \cdot [1]$

这里 $C_{I} = cm (0, 1, \dots, n - 1)$

4. 对比理解 Offline Memory Checking

与 Plookup, Caulk/Caulk+, flookup, Baloo, CQ 相比， Memory-in-the-head 方式证明 Lookup 是一个巧妙且直观的想法。不过我们会想知道他们之间有何差别？

这一节，我们从 Plookup 的角度出发，换一个角度来理解 Offline memory checking。

我们先假设 $f$ 中不存在重复元素，那么我们可以采用 Vanishing Form 的方式来编码 $f$ 与 $t$ 为多项式：

$f (X) = (X - f_{0}) (X - f_{1}) (X - f_{2}) \dots (X - f_{m - 1})$

$t (X) = (X - t_{0}) (X - t_{1}) (X - t_{2}) \dots (X - t_{n - 1})$

Prover 可以通过下面的等式来证明 $f \subset t$ ：

$\exists q (X), t (X) = f (X) \cdot q (X)$

但是如果考虑 $f$ 中存在重复元素，那么用 Vanishing Form 编码的多项式就不满足上面的等式约束了。处理重复元素是 Lookup Argument 中比较棘手的问题。为了修补这个方案，我们要为表格向量 $t$ 和查询向量 $f$ 分别扩展一个新的列向量，称为计数器列 $c$ 。每当 $f$ 中出现重复读取同一个表格元素时，我们可以通过计数器列来区分这两次不同的读取。比如 $f$ 中有两次对 $t_{0}$ 的查询，那么我们可以定义一个扩展后的查询向量 $f^{*}$ :

$f^{*} = [(t_{0}, 0), (t_{0}, 1), (t_{1}, 0)]$

扩展后的向量中的每一个元素是一个二元组，其中第二部分为计数器值。扩展查询中的前两个查询 $(t_{0}, 0), (t_{0}, 1)$ ，虽然查询值都为 $t_{0}$ ，但是由于计数器会按顺序加一，因此，两个二元组不再相等。

同样，我们也可以定义一个扩展后的表格向量 $t^{*}$ :

$t^{*} = [(t_{0}, 0), (t_{1}, 0)]$

那么我们会问下面的公式会成立吗？

${f_{j}^{*}} \subset ? {t_{i}^{*}}$

很显然，它不成立，因为等式左边有 $(t_{0}, 1)$ ，而右边的集合中不包含这个元素。显然我们需要在公式的右边补上 $(t_{0}, 1)$ 。换句话说，我们需要在右边补上那些由于计数器累加产生的重复表项，记为 $p^{*}$ 。

${f_{j}^{*}} \subset ? {t_{i}^{*}} \cup {p_{j}^{*}}$

但是这个向量 $p$ 不能由 Prover 提供。为了防止 Prover 作弊， $p$ 必须由 Verifier 来提供。那么接下来，我们面临的问题是，Verifier 并不清楚哪些 $f_{i}$ 重复，并且也不能知道重复了几次。这个问题该如何解决？

我们可以把查询 $f_{j}^{*}$ 看成是一个「消耗」表格元素的机器，每次查询 $f_{i}$ ，都会消耗掉一个对应的表格元素 $t_{j}$ 。我们把向量 $p^{*}$ 看成一个可以「产生」新元素的机器，每次出现一个对 $t_{j}$ 重复查询的记录，比如 $f_{i}^{*} = (t_{j}, c_{i})$ ，那么 $p^{*}$ 就会自动产生出一个新的元素，记为 $(t_{j}, c_{i} + 1)$ ，供下一次查询「消耗」。这样我们就可以让 Verifier 在等式左边添加 $m$ 个元素，正好对应 $f$ 的元素，但是所有元素中的计数器都自增一。这样，等式左边的集合 ${p_{j}^{*}}$ 就可以由 Verifier 自行构造：

$p_{j} = (f_{j}, c_{j} + 1)$

这个公式成立 ${f_{j}^{*}} \subset {t_{i}^{*}} \cup {p_{j}^{*}}$ ，我们继续可以用 Vanishing Form 的方式来表达这个子集关系，比如对上面的例子，我们可以得到下面的多项式等式：

$(X - t_{0}) (X - t_{1}) \cdot p (X) = (X - t_{0}) (X - t_{0} - β) (X - t_{1}) \cdot q (X)$

其中 $β$ 为 Verifier 提供的随机挑战数，用来合并表格 $t$ 和 $f$ 的二元组为一个单值。这里 $p (X)$ 编码了那个能自动产生新元素的机器，它的每一个因子都是一个 $(t_{i}, c_{i} + 1)$ 元素。下面是 $p (X)$ 多项式的定义：

$p (X) = (X - t_{0} - β) (X - t_{0} - 2 β) (X - t_{1} - β)$

多项式等式右边的多项式 $q (X)$ 会有哪些元素呢？ $q (X)$ 恰好包含有所有的等待被消耗的 $t_{i}$ 元素，其中包括始终没有被查询过的计数器为零的元素，还包括被查询过的，但是又被 $p^{*}$ 复制产生的元素。于是我们得到了下面的等式约束：

$t (X) {(t_{i}, 0)}_{i \in [n]} \cup p (X) {(f_{i}, c_{i} + 1)}_{i \in [m]} = f (X) {(f_{i}, c_{i})}_{i \in [m]} \cup q (X) {(t_{i}, c_{i}^{'})}_{i \in [n]}$

下面我们证明上面的等式保证了 $f$ 中的每一个元素都是 $t$ 中的元素。

我们用反证法，假如存在一个 $f_{i} \neq \in t$ ，那么根据上面的等式，一定存在一个计数器 $(f_{i}, k)$ 出现在等式的左边。这时候如何 $k = 0$ ，那么 $f_{i} = t_{i}$ ，与假设矛盾。那么这时候可以断定 $k > 0$ ，那么等式右边一定存在一个 $(f_{i}, k - 1)$ ，才会让左边出现 $(f_{i}, k)$ ；同理可推，左边一定存在一个 $(f_{i}, k - 1)$ ，那么右边一定会出现一个 $(f_{i}, k - 2)$ 。以此类推，我们一定可以得到：等式左边会出现 $(f_{i}, 0)$ ，于是 $f_{i} = t_{i}$ ，这又与初始初始假设矛盾。

这个思路与 Memory-in-the-head 几乎一摸一样，除了我们不考虑表格的索引问题。基于这个思路，我们可以构造一个 Unindexed Lookup Argument。

对比 Plookup

回忆下 Plookup 的方案，对于 $f$ 和 $t$ ，如果我们要证明 $f \subset t$ ，那么 Prover 需要引入一个中间向量 $s$ ，长度为 $n + m$ 。它是 $f \cup t$ 的一个重新排序，按照 $t$ 中原有项的顺利进行排列。然后 Prover 证明下面的 Multiset 等价关系：

${(s_{i}, s_{i + 1})} = ? {(f_{i}, f_{i})} \cup {(t_{i}, t_{i + 1})}$

这个方案和 Memory-checking 相比，Multiset 约束等式两边的集合元素数量都为 $m + n$ ，但 Plookup 需要多引入一个中间辅助向量 $s$ ，而后者则需要引入一个计数器向量 $c$ 。计数器向量节省了 Prover 在排序上的工作开销，另一方面，向量 $c = (0, 1, \dots, m - 1)$ 中的值较小且规律，Prover 计算其承诺会更有优势（如 Perdesen 承诺或者 KZG10）。

5. 小结

本文介绍了如何采用传统的 Offline Memory Checking 技术构造 Lookup Arguments，其中关于 Memory Checking 的公式 $S_{0} \cup W = R \cup S_{m}$ 蕴含着非常巧妙的思想。

References

[SL20] Quarks: Quarks: Quadruple-efficient transparent zkSNARKs by Srinath Setty and Jonathan Lee.
[Lasso] Unlocking the lookup singularity with Lasso by Srinath Setty, Justin Thaler and Riad Wahby.
[Jolt] Jolt: SNARKs for Virtual Machines via Lookups by Arasu Arun, Srinath Setty and Justin Thaler.
[PLONK] PLONK: Permutations over Lagrange-bases for Oecumenical Noninteractive arguments of Knowledge by Ariel Gabizon, Zachary J. Williamson and Oana Ciobotaru.
[Plookup] plookup: A simplified polynomial protocol for lookup tables by Ariel Gabizon and Zachary J. Williamson.
[Caulk] Caulk: Lookup Arguments in Sublinear Time by Arantxa Zapico, Vitalik Buterin, Dmitry Khovratovich, Mary Maller, Anca Nitulescu and Mark Simkin
[Caulk+] Caulk+: Table-independent lookup arguments by Jim Posen and Assimakis A. Kattis.
[Baloo] Baloo: Nearly Optimal Lookup Arguments by Arantxa Zapico, Ariel Gabizon, Dmitry Khovratovich, Mary Maller and Carla Ràfols.
[CQ] cq: Cached quotients for fast lookups by Liam Eagen, Dario Fiore and Ariel Gabizon.

理解 Lasso (二)：稀疏向量与 Tensor 结构

作者: Yu Guo@Secbit(郭宇): Founder of Secbit, https://github.com/sec-bit

本文我们介绍一个基于 Sumcheck 的「稀疏多项式承诺方案」 Spark，这个方案最早出自 [Spartan] 证明系统。Spark 利用了稀疏向量的结构，可以大幅提升 Prover 的效率。Lasso 是在 Spark 的基础上的进一步拓展了对稀疏向量的处理。理解 Spark 是理解 Lasso 的关键。

普通的多项式承诺方案包括两个阶段，一个是承诺（Commitment）阶段，另一个是求值证明（Evaluation Argument）阶段。对于一个 MLE 多项式 $g \in F [X_{0}, X_{1}, \dots, X_{n - 1}]^{⪯ 1}$ ，求值点 $u \in F^{n}$ ，以及运算结果 $v = g (u)$ ，那么多项式承诺计算如下：

$cm (g) \leftarrow PCS.Commit (\tilde{g})$

在求值证明阶段，Prover 可以向 Verifier 证明多项式 $\tilde{g}$ 在某一个指定点 $u$ 的运算结果为 $v$ ：

$π_{g, v} \leftarrow PCS.Eval (cm (g), u, v; \tilde{g})$

Verifier 可以验证求值证明 $π_{g, v}$ ：

$Accept / Reject \leftarrow PCS.Verify (cm (g), u, v, π_{v})$

如果 $\tilde{g}$ 是一个稀疏的多项式，意味着它在 Boolean HyperCube 上的运算结果中多数的值都为零，那么我们能否利用这个特点，来设计一个针对稀疏多项式更高效的多项式承诺方案？

下面我们演示如何构造 Spark 多项式承诺。不过请记住，Spark 仍然需要基于一个普通的多项式承诺方案。换句话说，Spark 协议是将一个稀疏的 MLE 多项式的求值证明「归约」到多个普通的 MLE 多项式的求值证明，但后者这些 MLE 多项式的大小被大幅减少。

1. 稀疏向量的编码

我们考虑一个长度为 $N = 2^{n}$ 的稀疏向量 $g = (g_{0}, g_{1}, \dots, g_{N - 1})$ 是一个 MLE 多项式 $\tilde{g} (X)$ 在 Boolean HyperCube ${0, 1}^{n}$ 上的取值。记住 $g$ 是一个稀疏的向量，其中除了 $m$ 个非零元素之外其余值都为零。

先回忆下 MLE 多项式 $\tilde{g} (X)$ 的定义：

$g (X) = i = 0 \sum N - 1 g_{i} \cdot e q_{i} (X)$

其中 $e q_{i} (X) = e q (bits (i), X)$ 是 MLE Lagrange 多项式。 $\tilde{e q} (X, Y)$ 定义如下：

$\tilde{e q} (X, Y) = i = 0 \prod n - 1 (X_{i} Y_{i} + (1 - X_{i}) (1 - Y_{i}))$

如果直接使用一个普通的 MLE 多项式承诺方案来证明多项式求值， $g (u) = v$ ，由于 $g (X)$ 是一个关于 $N$ 项的求和公式，那么很显然 Prover 要至少花费 $O (N)$ 的计算量来遍历每一个求和项。

如果给定一个求值点 $X = u = (u_{0}, u_{1}, \dots, u_{n - 1})$ ，那么所有的 $\tilde{e q}_{i} (u), i \in [0, N)$ 就构成了一个长度为 $N$ 的向量，记为 $λ$ ：

$λ = (e q_{0} (u), e q_{1} (u), e q_{2} (u), \dots, e q_{N - 1} (u))$

别忘记稀疏向量 $g$ 中仅有 $m$ 个非零元素。举个例子，比如 $N = 16, n = 4, m = 4$ ，即 $g$ 向量中仅有四个非零值：

$g = (0, 0, g_{2}, 0, 0, 0, 0, g_{7}, 0, g_{9}, 0, 0, 0, 0, g_{14}, 0)$

那么我们可以换用一种稠密的方式来表示 $g$ ：

$DenseRepr (g) = ((2, g_{2}), (7, g_{7}), (9, g_{9}), (14, g_{14}))$

可以看出，向量 $g$ 的稠密表示是一个长度仅为 $m$ 的向量，其每一个元素为非零元素位置和非零元素值的二元组。我们再把上面二元组向量中的位置值单独记为 $k = (k_{0}, k_{1}, \dots, k_{m - 1})$ 向量，把元组中非零的 $g_{i}$ 记为 $h = (h_{0}, h_{1}, \dots, h_{m - 1})$ 向量：

$h k = (g_{2}, g_{7}, g_{9}, g_{14}) = (2, 7, 9, 14)$

那么 $g$ 的稠密表示可以写成：

$DenseRepr (g) = ((k_{0}, h_{0}), (k_{1}, h_{1}), \dots, (k_{m - 1}, h_{m - 1}))$

然后 MLE 多项式 $\tilde{g} (X)$ 在 $u$ 点的求值等式可以改写为：

$g (u) = i = 0 \sum m - 1 h_{i} \cdot e q_{k_{i}} (u) = i = 0 \sum m - 1 h_{i} \cdot λ_{k_{i}}$

注意上面这个等式中的求和项的个数仅为 $m$ 。这意味着在给定 $h$ 和 $λ$ 的情况下，我们成功地把 $\tilde{g} (X)$ 的求值运算从 $O (N)$ 降到了 $O (m)$ 。接下来的问题是 Prover 如何向 Verifier 证明求值过程用到了正确的 $h_{i}$ 和 $λ_{k_{i}}$ ？

对于一个多项式承诺方案，求值证明的公开输入里面包括了 $g$ 向量的承诺，但是上面的求和式需要用到辅助向量 $h$ ， $k$ 和 $λ$ 。其中 $λ$ 向量可以通过求值点 $u$ 计算得到，其中每个元素为 $λ_{i} = \tilde{e q}_{i} (u)$ ，而求值点 $u$ 为公开输入，因此 Verifier 可以公开计算 $λ$ 向量或者公开验证。但 Verifier 并不能由 $g$ 向量的承诺来直接得到 $h$ 和 $k$ 这两个向量的信息。因此，我们需要把 $h$ 和 $k$ 的承诺来替代公开输入中的 $g$ 向量的承诺。

换句话说，我们采用 $h$ 和 $k$ 来作为稀疏向量的 $g$ 的编码，并利用一个普通的多项式承诺方案来计算 $cm (h)$ 和 $cm (k)$ ，并把它们作为多项式求值证明的承诺（做为公开输入）。

2. 借助 $e$ 的 Sumcheck

我们需要引入一个长度为 $m$ 的辅助向量 $e = (e_{0}, e_{1}, \dots, e_{m - 1})$ ，它的每一个元素 $e_{i} = λ_{k_{i}}$ ：

$e = (e q_{k_{0}} (u), e q_{k_{1}} (u), \dots, \tilde{e q}_{k_{m - 1}} (u))$

这样 $\tilde{g} (X)$ 在 $u$ 点的求值等式等价于下面的求和等式:

$g (u) = i = 0 \sum m - 1 h (bits (i)) \cdot \tilde{e} (bits (i))$

其中 $e (X)$ 是一个编码了 $e$ 的 MLE 多项式， $h (X)$ 是关于 $h$ 的 MLE 多项式

$e (X) = i = 0 \sum m - 1 e_{i} \cdot e q_{i} (X) h (X) = i = 0 \sum m - 1 h_{i} \cdot e q_{i} (X)$

如果 Prover 要证明上面的求和式，首先提供 $e$ 的承诺 $cm (e)$ 给 Verifier，然后通过接下来的两部分来完成证明。

第一部分证明是 Prover 利用 Sumcheck 协议，把 $\tilde{g} (u)$ 的求值证明规约到下面的等式

$v^{'} = ? h (ρ) \cdot e (ρ)$

其中 $v^{'}$ 为 Sumcheck 协议对 $m$ 个求和项进行折叠运算后的结果，而 $ρ$ 为 Sumcheck 运行过程中 Verifier 产生的随机折叠因子。因为 Sumcheck 过程需要 $lo g m$ 轮，所以 $ρ$ 的长度为 $lo g m$ 。

接下来 Prover 怎么证明上面的等式呢？在求值证明之前，Verifier 已经从公开输入中得到了 $h$ , $e$ 两个向量的承诺，分别为 $cm (h)$ 与 $cm (e)$ ，那么到这一步，Prover 和 Verifier 可以再利用普通的 MLE 多项式承诺方案来完成两个 Evaluation Argument，即分别证明： $h (ρ) = v_{h}$ 与 $e (ρ) = v_{e}$ 的正确性，因为这两个向量长度均为 $m$ ，因此 Prover 产生这两个 Evaluation Argument 的计算量为 $O (m)$ 。最后 Verifier 验证 $v = ? v_{h} \cdot v_{e}$ 完成第一部分的证明。

第二部分证明是 Prover 证明 $e$ 向量关于 $λ$ , $u$ 与 $k$ 的正确性，这就需要用到前文介绍过的 Offline Memory Checking 方法：Prover 只要证明 $e$ 向量中的每一个元素都是从 $λ$ 向量（看成是内存）中读取出来的即可。这样 Prover 总的计算量为 $O (m + N)$ 。

3. 使用 Memory Checking 证明 $e$ 的正确性

辅助向量 $e$ 的正确性证明正是 Indexed Lookup Argument：

$\forall i \in [0, m), e_{i} = λ_{k_{i}}$

借助 Memory Checking 协议，我们把整个 $λ$ 向量（公开向量）看成是一段内存，Prover 证明 $e$ 向量依次读取自内存 $λ$ ，读取的位置为 $k$ 。Prover 可以在 $O (m + N)$ 的计算量内完成上面的证明。

$MemChecking (cm (e), cm (λ), cm (k); e, λ, k_{i})$

结合前文的定义，这里 $e$ 为查询向量 $f$ ， $λ$ 为表格向量 $t$ ，而 $k$ 为位置向量 $a$ 。

但还有一个问题， $λ$ 的承诺 $cm (λ)$ 怎么产生？向量元素 $λ_{i} = e q_{i} (u)$ ，其定义中含有一个求值阶段才出现的公开输入 $u$ ，因此不能在 $g$ 的承诺阶段中出现，也无法出现在 $g (X)$ 求值证明的公开输入中，一般情况多项式承诺方案的公开输入为 $(cm (g), u, g (u))$ 。如果由 Prover 计算 $cm (λ)$ 的话，那么 Prover 需要额外证明承诺的正确性。

幸运的是， $λ$ 向量具有一定内部的结构，虽然它的长度为 $N$ ，但在给定 $u$ 的情况下，它的插值多项式 $λ (X)$ 可以在 $O (lo g N)$ 的时间内进行求值计算，于是这样一来 Prover 可以不需要提供 $cm (λ)$ ，而是让 Verifier 在验证过程中自行计算 $λ (X)$ 在某一点的取值。我们观察下 $\tilde{λ} (X)$ 的定义：

$λ (X) = e q (X, u)$

容易检验，对于任意的 $i \in [0, N)$ ，

$λ_{i} = λ (bits (i)) = e q (bits (i), u) = j = 0 \prod l o g N - 1 (i_{j} u_{j} + (1 - i_{j}) (1 - u_{j}))$

上面等式最右边是一个 $lo g N$ 项的乘积，其中每一个因子只需要常数次的加法和乘法。接下来我们稍微修改下前文中的 Offline Memory Checking 协议，把公开输入中的 $cm (λ)$ 替换为 $u$ ，并且让 Verifier 自行计算 $\tilde{λ} (X)$ 的值。

Memory Checking 协议描述

公共输入：

$C_{e} = cm (e)$ ， $∣ e ∣ = m$
$C_{k} = cm (k)$ ， $∣ k ∣ = m$
$u$ , $∣ u ∣ = n = lo g N$

第一轮

Prover 计算 $S_{m}$ , ${R_{j}}_{j \in [m]}$ ， ${W_{j}}_{j \in [m]}$

$S_{m} R_{j} W_{j} = {(i, λ_{i}, c_{i}^{final})}_{i \in [m]} = (k_{j}, e_{j}, c_{j}), j \in [m] = (k_{j}, e_{j}, c_{j} + 1), j \in [m]$

Prover 计算并发送计数器的承诺 $C_{c} = cm ({c_{j}})$ ， $C_{c}^{final} = cm ({c_{i}^{final}})$

第二轮

Verifier 发送挑战数 $β, γ$

Prover 计算 ${R_{j}}$ , ${W_{j}}$ ,

$R_{j} W_{j} = k_{j} + β \cdot e_{j} + β^{2} \cdot c_{j} - γ = k_{j} + β \cdot e_{j} + β^{2} \cdot (c_{j} + 1) - γ$

Prover 计算 ${S_{i}^{init}}$ 与 ${S_{i}^{final}}$

$S_{i}^{init} S_{i}^{final} = i + β \cdot λ_{i} + β^{2} \cdot 0 - γ = i + β \cdot λ_{i} + β^{2} \cdot c_{i}^{final} - γ$

Prover 和 Verifier 利用基于 Sumcheck 的 Grand Product Argument 来证明下面的等式：

$(i = 0 \prod N - 1 S_{i}^{init}) \cdot (j = 0 \prod m - 1 R_{j}) = (i = 0 \prod N - 1 S_{i}^{final}) \cdot (j = 0 \prod m - 1 W_{j})$

Grand Product Argument 证明最后会归约到对多个 MLE 多项式的求值证明，也就是对 $S^{init} (X)$ ， $S^{final} (X)$ ， $R (X)$ ， $W (X)$ 的求值证明。这些证明可以归约到 $I (X), k (X), e (X), c (X), c^{final} (X)$ 与 $λ (X)$ 的求值证明。注意我们前面提到过， Verifier 不需要 $λ (X)$ 的承诺求值证明，他可以自行计算 $λ (X)$ 在任意点的求值。因为该多项式的求值计算量仅为 $O (lo g N)$ ，不影响 Verifier 的简洁性（Succinctness）。

进一步，任何计算过程仅为 $O (lo g N)$ 的 MLE 多项式，Prover 也不必要一定计算它们的承诺，只要把计算任务交给 Verifier 就好。这样 Verifier 仍然保持 SNARK 的特性，同时也提高了 Prover 的效率，省去了计算承诺和产生求值证明的工作量。前提是，这一类 MLE 多项式需要具有一种特殊的内部结构，我们后文会把它们归到一个特殊的分类：MLE-Structured Vector。

对于 Prover 而言，仍然需要在证明过程中构造 $λ$ ，通过动态规划算法，这需要 $O (N)$ 的计算量。

$λ = (e q_{0} (r), e q_{1} (r), e q_{2} (r), \dots, e q_{N - 1} (r))$

4. 求值证明协议细节

1. 承诺阶段：

Prover 要计算下面两个承诺：

$cm (h)$ ：稀疏向量 $g$ 中的非零元素向量 $h$ 的承诺
$cm (k)$ ： $g$ 中的所有非零元素在 $g$ 中的位置向量 $k$ 的承诺

2. 求值证明阶段：

公共输入：

多项式的承诺 $(cm (h), cm (k))$
求值点 $u$ ，以及运算结果 $v = \tilde{g} (u)$

第一轮：

Prover 计算 $λ$ ，作为内存模拟
Prover 计算 $e$ ，并发送承诺 $cm (e)$ ，作为 memory 顺序读取出的内容

第二轮：Prover 与 Verifier 执行 Offline Memory Checking 协议，证明

$e_{i} = λ_{k_{i}}, \forall i \in [m]$

第三轮：Prover 与 Verifier 执行 Sumcheck 协议，证明

$v = i \in [0, m) \sum h_{i} \cdot e_{i}$

并把上面的求和等式归约到

$v^{'} = h (ρ) \cdot e (ρ)$

其中 $ρ$ 为 Verifier 在 Sumcheck 过程中发送的挑战向量。

第四轮：Prover 发送 $(v_{h}, v_{e}, π_{h}, π_{e})$

$v_{h} = \tilde{h} (ρ)$ ，求值证明为 $π_{h}$
$v_{e} = \tilde{e} (ρ)$ ，求值证明为 $π_{e}$

验证： Verifier 验证 $π_{h}$ 与 $π_{e}$ 的有效性，并验证下面的等式：

$v^{'} = ? v_{h} \cdot v_{e}$

性能分析

Prover 在 Memory-checking 协议中的性能开销为 $O (m + N)$ ，因为内存的大小为 $N$ ，读取序列长度为 $m$ ；在 Sumcheck 协议中为 $O (m)$ 。因此 Prover 总的计算开销为 $O (m + N)$ 。

这样一个稀疏多项式承诺方案其实并不理想，因为 Prover 的计算量仍然与 $N$ 线性有关。我们希望能够进一步减少 Prover 的计算量，这就需要进一步探索 $λ$ 的内部结构。

5. 向量 $e$ 二维分解

为何 $\tilde{λ} (X)$ 的求值计算量仅为 $O (lo g N)$ ? 因为向量 $λ$ 具有一种特殊的结构——Tensor Structure，也就是它可以拆分成多个短向量的 Tensor Product。简化起见，我们试着把 $λ_{i}$ 按照下面的方法拆分成两部分的乘积：

$λ_{i} = e q (bits (i), u) = j = 0 \prod n - 1 (bits (i)_{j} \cdot u_{j} + (1 - bits (i)_{j}) \cdot (1 - u_{j})) = j = 0 \prod n /2 (bits (i)_{j} \cdot u_{j} + (1 - bits (i)_{j}) \cdot (1 - u_{j})) \cdot j = n /2 + 1 \prod n - 1 (bits (i)_{j} \cdot u_{j} + (1 - bits (i)_{j}) \cdot (1 - u_{j})) = e q (bits^{(high)} (i), (u_{0}, u_{1}, \dots, u_{n /2})) \cdot \tilde{e q} (bits^{(low)} (i), (u_{n /2 + 1}, \dots, u_{n - 1}))$

这里 $i_{0} = bits^{(high)} (i)$ 和 $i_{1} = bits^{(low)} (i)$ 是把 $i$ 的二进制位拆分成相等的两段所表示的数值。举个例子，比如 $i = (13)_{10}$ 是一个十进制数，它的二进制表示为 $bits (i) = (1101)_{2}$ 。我们可以把它拆成高二位与低二位，分别为 $i_{0} = (11)_{2}$ 和 $i_{1} = (01)_{2}$ ，那么 $i_{0} = 3, i_{1} = 1$ 。我们引入一个新的「拼接记号」， $i = i_{0} ∥ i_{1}$ 表示 $i$ 的二进制位为其高位和低位两个数的二进制位的拼接，按照 Big-endian 的方式。比如 $(1101)_{2} = (11)_{2} ∥ (01)_{2}$ 。不难验证，拼接操作满足性质： $i ∥ j = i + N \cdot j$ 。

按照上面的分解方法，我们可以分解 $λ_{13}$ 为两个值的乘积：

$λ_{13} = e q ((11)_{2}, (u_{0}, u_{1})) \cdot e q ((01)_{2}, (u_{2}, u_{3}))$

对于长度为 $N$ 的 $λ$ 向量中的所有元素 $λ_{i}$ ，我们可以把其中每一个元素都按照相同拆分方式进行分解：

$λ_{0} λ_{1} λ_{2} λ_{3} ⋮ λ_{15} = e q ((00)_{2}, (u_{0}, u_{1})) \cdot e q ((00)_{2}, (u_{2}, u_{3})) = e q ((00)_{2}, (u_{0}, u_{1})) \cdot e q ((01)_{2}, (u_{2}, u_{3})) = e q ((00)_{2}, (u_{0}, u_{1})) \cdot e q ((10)_{2}, (u_{2}, u_{3})) = e q ((00)_{2}, (u_{0}, u_{1})) \cdot e q ((11)_{2}, (u_{2}, u_{3})) = e q ((11)_{2}, (u_{0}, u_{1})) \cdot e q ((11)_{2}, (u_{2}, u_{3}))$

我们进而把这 16 个元素排成一个 $4 \times 4$ 的矩阵，每一个单元格的值 $λ_{i}$ 都等于它对应的行向量元素和列向量元素的乘积。

$e q_{0} (u_{2}, u_{3}) e q_{1} (u_{2}, r_{3}) e q_{2} (u_{2}, u_{3}) e q_{3} (u_{2}, u_{3}) e q_{0} (u_{0}, u_{1}) e q_{0 ∥ 0} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{0 ∥ 1} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{0 ∥ 2} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{0 ∥ 3} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{1} (u_{0}, u_{1}) e q_{1 ∥ 0} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{1 ∥ 1} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{1 ∥ 2} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{1 ∥ 3} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{2} (u_{0}, u_{1}) e q_{2 ∥ 0} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{2 ∥ 1} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{2 ∥ 2} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{2 ∥ 3} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{3} (u_{0}, u_{1}) e q_{3 ∥ 0} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{3 ∥ 1} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{3 ∥ 2} (u_{0}, u_{1}, u_{2}, u_{3}) e q_{3 ∥ 3} (u_{0}, u_{1}, u_{2}, u_{3})$

如果把上面表格的第一行的元素组成向量，记为 $λ^{(x)}$ ，第一列记为 $λ^{(y)}$ ：

$λ^{(x)} λ^{(y)} = (e q_{0} (u_{0}, u_{1}), e q_{1} (u_{0}, u_{1}), e q_{2} (u_{0}, u_{1}), e q_{3} (u_{0}, u_{1})) = (e q_{0} (u_{2}, u_{3}), e q_{1} (u_{2}, u_{3}), e q_{2} (u_{2}, u_{3}), e q_{3} (u_{2}, u_{3}))$

那么 $λ$ 向量看成是两个长度为 $N$ 的向量的 Tensor Product：

$λ = λ^{(x)} \otimes λ^{(y)}$

回到我们关注的向量 $e$ ，其中每一个元素 $e_{i}$ 也就可以看成是两个数值的乘积 $e_{i} = e_{i}^{(x)} \cdot e_{i}^{(y)}$ ，其中 $e_{i}^{(x)}$ 来自于 $λ^{(x)}$ ，另一个 $e_{i}^{(y)}$ 来自于 $λ^{(y)}$ 。

这相当于我们把整个 $e$ 向量分解到了一个二维空间中，它的值等于横坐标和纵坐标值的乘积。那么我们可以继续采用 Offline Memory Checking 的思路来证明 $e$ 的正确性，这次我们需要采用二维的 Offline Memory Checking 协议。更直白点说，我们需要采用两次 Offline Memory Checking 协议来证明 $e$ 的正确性，每一个 $e_{i}$ 对应到两个值的乘积，它们分别读取自 $λ^{(x)}$ 和 $λ^{(y)}$ ：

$MemChecking (cm (e^{(x)}), λ^{(x)}, cm (k^{(x)}); e^{(x)}, k^{(x)}) MemChecking (cm (e^{(y)}), λ^{(y)}, cm (k^{(y)}); e^{(x)}, k^{(y)})$

于是稀疏多项式 $\tilde{g} (X)$ 的求值等式可以改写为：

$g (u) = g (u_{0}, u_{1}) = i = 0 \sum m - 1 h (bits (i)) \cdot e^{(x)} (bits (i)) \cdot \tilde{e}^{(y)} (bits (i))$

其中

$e^{(x)} e^{(y)} = (e q_{k_{0}^{(x)}} (u_{0}), e q_{k_{1}^{(x)}} (u_{0}), \dots, e q_{k_{m - 1}^{(x)}} (u_{0})) = (e q_{k_{0}^{(y)}} (u_{1}), e q_{k_{1}^{(y)}} (u_{1}), \dots, e q_{k_{m - 1}^{(y)}} (u_{1}))$

其中 $k_{i}^{(x)}, k_{i}^{(y)} \in (0, 1, \dots, lo g N /2)$ 为非零元素 $h_{i}$ 在二维矩阵中的行列坐标。这样我们可以把求值协议中的 Offline Memory Checking 子协议调用两次，但是内存的大小被大幅缩小到了 $N = 2^{n /2}$ 。看下前面的例子， $N = 16, n = 4, m = 4$ ， $g$ 向量中仅有四个非零值：

$g = (0, 0, g_{2}, 0, 0, 0, 0, g_{7}, 0, g_{9}, 0, 0, 0, 0, g_{14}, 0)$

向量 $h$ 为非零向量：

$h = (g_{2}, g_{7}, g_{9}, g_{14})$

这时候，我们可以采用二维坐标 $(k_{i}^{(x)}, k_{i}^{(y)})$ 来标记 $h_{i}$ 在 $g$ 矩阵中的位置，标记矩阵中的行和列：

$(k_{0}^{(x)}, k_{0}^{(y)}) (k_{1}^{(x)}, k_{1}^{(y)}) (k_{2}^{(x)}, k_{2}^{(y)}) (k_{3}^{(x)}, k_{3}^{(y)}) = (2, 0) = (3, 1) = (1, 2) = (2, 3)$

我们把其中行坐标向量记为 $k^{(x)}$ ，列坐标向量记为 $k^{(y)}$ ，那么 $\tilde{g} (u)$ 可以表示为

$g (u_{0}, u_{1}, u_{2}, u_{3}) = 0 \leq i < 4 \sum h_{i} \cdot e q (bits (k_{i}^{(x)})), (u_{0}, u_{1})) \cdot \tilde{e q} (bits (k_{i}^{(y)}), (u_{2}, u_{3})) = 0 \leq i < 4 \sum h_{i} \cdot e_{i}^{(x)} \cdot e_{i}^{(y)}$

经过 Sumcheck 协议之后，上述等式可以被归约到：

$v^{'} = h (ρ) \cdot e^{(x)} (ρ) \cdot \tilde{e}^{(y)} (ρ)$

然后 Prover 再提供三个 MLE 多项式在 $ρ$ 点的取值， $(v_{h}, v_{x}, v_{y})$ 的求值证明。

在这个二维的求值协议中，Prover 的计算开销就从上一节的 $O (m + N)$ 降低到了 $O (m + 2 N)$ 。

下面我们给出完整的二维稀疏多项式承诺方案。

6. 二维稀疏多项式承诺 Spark

利用上面的思路，我们把稀疏向量 $g$ 重新排列成一个 $N \times N$ 的二维矩阵 $G$ 。为了排版清晰，我们引入符号 $l = N$ ：

$G = g_{0} g_{l} g_{2 l} ⋮ g_{(l - 1) l} g_{1} g_{l + 1} g_{2 l + 1} ⋮ g_{(l - 1) l + 1} g_{2} g_{l + 2} g_{2 l + 2} ⋮ g_{(l - 1) l + 2} \dots \dots \dots ⋱ \dots g_{l - 1} g_{2 l - 1} g_{3 l - 1} ⋮ g_{l^{2} - 1}$

6.1. 承诺阶段：

Prover 要计算下面两个承诺：

$C_{h} = cm (h)$ ：稀疏向量 $g$ 中的非零元素向量 $h$ 的承诺
$C_{x} = cm (k^{(x)})$ ： $h$ 中的所有非零元素在矩阵 $G$ 中的行坐标构成的向量 $k^{(x)}$ 的承诺
$C_{y} = cm (k^{(y)})$ ： $h$ 中的所有非零元素在矩阵 $G$ 中的列坐标构成的向量 $k^{(y)}$ 的承诺

令 $Spark.Commit (g) \to cm_{g}^{(spark)} = (C_{h}, C_{x}, C_{y})$ ，这个三元组承诺我们用符号 $cm_{g}^{(spark)}$ 表示。

6.2. 求值证明阶段：

$π_{g}^{(spark)} \leftarrow Spark.Eval ((C_{h}, C_{x}, C_{y}), u, v; (h, x, y))$ ：

公共输入：

多项式的承诺 $cm_{g}^{(spark)} = (C_{h}, C_{x}, C_{y})$
求值点 $u$ ，这个点可以拆分为两个子向量 $u = u_{x} ∥ u_{y}$ ，其中 $∣ u_{x} ∣ = ∣ u_{y} ∣ = n /2$
以及运算结果 $v = \tilde{g} (u)$

第一轮：

Prover 计算 $λ^{(x)} = {e q_{i} (u_{x})}_{i \in [0, l)}$ ，作为 $mem_{x}$ 内存
Prover 计算 $λ^{(y)} = {e q_{i} (u_{y})}_{i \in [0, l)}$ ，作为 $mem_{y}$ 内存
Prover 计算 $e^{(x)}$ 与 $e^{(y)}$ ，作为分别从内存 $mem_{x}$ 与 $mem_{y}$ 读取出的内容，并发送承诺 $cm (e^{(x)})$ 与 $cm (e^{(y)})$

第二轮：Prover 与 Verifier 执行两次 Offline Memory Checking 协议，证明 $cm (e^{(x)})$ 与 $cm (e^{(y)})$ 的正确性：

$MemChecking (cm (e^{(x)}), u_{x}, cm (k^{(x)}); e^{(x)}, k^{(x)}) MemChecking (cm (e^{(y)}), u_{y}, cm (k^{(y)}); e^{(x)}, k^{(y)})$

第三轮：Prover 与 Verifier 执行 Sumcheck 协议，证明下面的等式求和

$v = i \in [0, m) \sum h_{i} \cdot e_{i}^{(x)} \cdot e_{i}^{(y)}$

并把求和等式归约到

$v^{'} = h (ρ) \cdot e^{(x)} (ρ) \cdot \tilde{e}^{(y)} (ρ)$

其中 $ρ$ 为 Verifier 在 Sumcheck 过程中发送的挑战向量，其长度为 $lo g m$ 。

第四轮：Prover 发送 $(v_{t}, v_{x}, v_{y}, π_{t}, π_{x}, π_{y})$

$v_{h} = \tilde{h} (ρ)$ ，求值证明为 $π_{h} = PCS.Eval (C_{h}, ρ, v_{h}; h)$
$v_{x} = \tilde{e}^{(x)} (ρ)$ ，求值证明为 $π_{x} = PCS.Eval (C_{x}, ρ, v_{x}; k^{(x)})$
$v_{y} = \tilde{e}^{(y)} (ρ)$ ，求值证明为 $π_{y} = PCS.Eval (C_{y}, ρ, v_{y}; k^{(y)})$

验证： Verifier 验证 $π_{h}$ ， $π_{x}$ 与 $π_{y}$ 的有效性，并验证下面的等式：

$v^{'} = ? v_{h} \cdot v_{x} \cdot v_{y}$

6.3. 性能分析

8. Tensor 结构 (TODO)

如果我们可以把 $e$ 分解到二维空间，那么能否分解到更高维的空间？比如 $f$ 的长度为 $2^{30}$ ，那么把它排成二维矩阵，比如 $2^{15} \times 2^{15}$ ，矩阵的长宽还是较大。如果把 $f$ 重新排列成一个立方体，然后同样把 $\tilde{e q}_{i} (r)$ 拆分成三段，这样我们可以把 Offline Memory Checking 的 Prover 开销进一步降低到 $O (N^{1/3})$ ，也就是 $2^{10}$ 。这个分解的灵活性来源于 $λ$ 的结构特性，即一个具有 Tensor Structure 的向量可以用不同的 Tensor Product 分解方式。理论上，我们可以把 $f$ 分解成 $lo g N$ 个长度为 $2$ 的短向量的 Tensor Product。不过实践中，我们只需要将其分解到 $N^{1/ c}$ 即可处理超长的向量。

例如当 $N = 16$ 时， $λ$ 即可以排列成一个 $4 \times 4$ 的二维矩阵，也可以排列成 $2 \times 2 \times 2 \times 2$ 的四维矩阵：

$λ = (r_{0}, 1 - r_{0}) \otimes (r_{1}, 1 - r_{1}) \otimes (r_{2}, 1 - r_{2}) \otimes (r_{3}, 1 - r_{3}) = ((r_{0}, 1 - r_{0}) \otimes (r_{1}, 1 - r_{1})) \otimes ((r_{2}, 1 - r_{2}) \otimes (r_{3}, 1 - r_{3})) = ((r_{0} r_{1}, (1 - r_{0}) r_{1}, r_{0} (1 - r_{1}), (1 - r_{0}) (1 - r_{1}))) \otimes ((r_{2} r_{3}, (1 - r_{2}) r_{3}, r_{2} (1 - r_{3}), (1 - r_{2}) (1 - r_{3})))$

我们可以根据 Tensor Product 逐步来推导下：

$(r_{0}, (1 - r_{0})) \otimes (r_{1}, (1 - r_{1})) = r_{1} (1 - r_{1}) r_{0} r_{0} r_{1} r_{0} (1 - r_{1}) (1 - r_{0}) (1 - r_{0}) r_{1} (1 - r_{0}) (1 - r_{1})$

再利用上面的计算结果来计算 $(r_{0}, (1 - r_{0})) \otimes (r_{1}, (1 - r_{1})) \otimes (r_{2}, (1 - r_{2}))$

$r_{0} r_{1} (1 - r_{0}) r_{1} r_{0} (1 - r_{1}) (1 - r_{0}) (1 - r_{1}) r_{2} r_{0} r_{1} r_{2} (1 - r_{0}) r_{1} r_{2} r_{0} (1 - r_{1}) r_{2} (1 - r_{0}) (1 - r_{1}) r_{2} (1 - r_{2}) r_{0} r_{1} (1 - r_{2}) (1 - r_{0}) r_{1} (1 - r_{2}) r_{0} (1 - r_{1}) (1 - r_{2}) (1 - r_{0}) (1 - r_{1}) (1 - r_{2})$

其实，许多常见的向量也具备 Tensor Structure，比如 $(1, α, α^{2}, \dots, α^{2^{n} - 1})$ ：

$(1, α, α^{2}, \dots, α^{2^{n} - 1}) = (1, α) \otimes (1, α^{2}) \otimes (1, α^{4}) \otimes \dots \otimes (1, α^{2^{(n - 1)}})$

7. 小结

本文介绍了 Tensor Structure 的概念，利用这个结构，我们可以把稀疏向量映射到一个二维空间中进行编码，然后我们基于这个结构，可以构造一个稀疏向量的多项式承诺方案。

References

[Spartan] Spartan: Efficient and general-purpose zkSNARKs without trusted setup by Srinath Setty.
[Lasso] Unlocking the lookup singularity with Lasso by Srinath Setty, Justin Thaler and Riad Wahby.
[Jolt] Jolt: SNARKs for Virtual Machines via Lookups by Arasu Arun, Srinath Setty and Justin Thaler.
[PLONK] PLONK: Permutations over Lagrange-bases for Oecumenical Noninteractive arguments of Knowledge by Ariel Gabizon, Zachary J. Williamson and Oana Ciobotaru.
[Plookup] plookup: A simplified polynomial protocol for lookup tables by Ariel Gabizon and Zachary J. Williamson.
[Caulk] Caulk: Lookup Arguments in Sublinear Time by Arantxa Zapico, Vitalik Buterin,Dmitry Khovratovich, Mary Maller, Anca Nitulescu and Mark Simkin
[Caulk+] Caulk+: Table-independent lookup arguments by Jim Posen and Assimakis A. Kattis.
[Baloo] Baloo: Nearly Optimal Lookup Arguments by Arantxa Zapico, Ariel Gabizon, Dmitry Khovratovich, Mary Maller and Carla Ràfols.
[CQ] cq: Cached quotients for fast lookups by Liam Eagen, Dario Fiore and Ariel Gabizon.

理解 Lasso (三)：大表格的稀疏查询证明

作者: Yu Guo@Secbit(郭宇): Founder of Secbit, https://github.com/sec-bit

Lasso 这个名字是 Lookup Arguments via Sparse-polynomial-commitments and the Sumcheck-check protocol, including for Oversized-tables 的缩写。这里面有三个关键词，

Sparse Polynomial Commitment
Sumcheck protocol
Oversized table

本文继续讨论如何利用 Sparse Polynomial Commitment 来构造 Indexed Lookup Argument。但为了能处理 Oversized Table（比如 $2^{128}$ 这样的表格），需要充分利用表格的内部结构。

1. 构造简易 Indexed Lookup Argument

前文介绍了 Sparse Polynomial Commitment，现在回到正题 Lookup Argument。下面是一种 Lookup 关系的表示：

$M t = f$

这里 $t$ 为表格向量，长度为 $N$ ， $f$ 为查找向量，长度为 $m$ ，选择矩阵 $M$ 大小为 $m \times N$ 。

我们引入三个 MLE 多项式 $M (X, Y), t (Y), \tilde{f} (X)$ 来分别编码矩阵 $M$ ，表格向量 $t$ ，与查找向量 $f$ ，那么它们满足下面的关系：

$y \in {0, 1}^{l o g N} \sum M (X, y) \cdot t (y) = \tilde{f} (X)$

Verifier 可以发送一个挑战向量 $r$ ，把上面的等式可以归约到：

$y \in {0, 1}^{l o g N} \sum M (r, y) \cdot t (y) = \tilde{f} (r)$

现在， Prover 要向 Verifier 证明上面的求和等式成立，我们会立即想到使用 $lo g N$ 轮的 Sumcheck 协议，把上面的等式归约到一个新的等式：

$M (r, ρ) \cdot t (ρ) = v^{'}$

其中 $v^{'}$ 为 $lo g N$ 个求和项折叠之后的值， $ρ$ 为 Verifier 在 Sumcheck 协议过程中发送的挑战值。这时 Verifier 要验证上面的等式，就需要 Prover 提供三个 MLE 的求值证明。因为 $M$ 矩阵是一个稀疏矩阵，因此 Prover 可以在协议最开头采用 Spark 协议来承诺 $M$ ，然后在 Sumcheck 协议的末尾， Prover 可以花费 $O (m + m \cdot N)$ 的计算量来产生 $M (r, ρ)$ 的 Evaluation 证明。这远好于 Prover 直接采用普通多项式承诺的开销， $O (m \cdot N)$ 。

协议细节

公共输入：

$C_{t} = PCS.Commit (t)$ ， $∣ t ∣ = n$
$C_{f} = PCS.Commit (f)$ ， $∣ f ∣ = m$
$C_{M}^{(spark)} = Spark.Commit (M)$ ， $∣ M ∣ = m \times N$

第一轮：Verifier 发送挑战向量 $r$

$y \in {0, 1}^{l o g N} \sum M (r, y) \cdot t (y) = \tilde{f} (r)$

第二轮：Prover 和 Verifier 执行 Sumcheck 协议，把上式归约到

$M (r, ρ) \cdot t (ρ) = v^{'}$

第三轮：Prover 发送 $(v_{M}, v_{t}, π_{M}^{(spark)}, π_{t})$

$(v_{M}, π_{M}^{(spark)}) = Spark.Eval (C_{M}^{(spark)}, (r, ρ), v_{M}; M)$
$(v_{t}, π_{t}) = PCS.Eval (C_{t}, ρ, v_{t}; t)$

当然，我们可以通过把 $M$ 整个向量排成一排，得到长度为 $m \times N$ 长的一维向量 $h$ ，然后把这个向量在一个 $c$ 维的空间中进行拆分:

$M (X^{(D_{1})}, \dots, X^{(D_{c})}) = i = 0 \sum m - 1 val (bits (i)) \cdot e q (bits (i), X^{(D_{1})}) \cdot \dots \cdot \tilde{e q} (bits (i), X^{(D_{c})})$

然后利用 Spark 协议来达到 $O (m + c c m \cdot N)$ 的 Proving Time 复杂度。但是 Prover 在产生 $π_{t}$ 时则需要 $O (N)$ 的计算量。那么总体上，Spark 虽然可以有效降低 Prover 的工作量，但是如果表格尺寸 $N$ 非常大，那么 Prover 仍然需要花费大量的时间来计算表格。那么还能不能更进一步呢？像 Caulk/Caulk+, cq 那样让 Prover 的性能开销变为关于 $N$ 的亚线性复杂度。

Lasso 协议正是朝着这个方向迈出了一大步，它甚至不需要像 cq 那样要实现对完整的大表格做预处理。尽管它不通用，只能针对几类特殊的表格，但不少常见的运算都可以证明。

Lasso 的核心思想是，我们能否把表格向量 $t$ 像稀疏向量一样按照多个维度去拆解？如果能像 Tensor Structure 那样，一个巨大的表格可以表示为若干个小表格的运算。这样 Prover 和 Verifier 就可以对多个小表格做 Lookup 证明，那么最终得到的效果就是：看起来我们可以实现一个虚拟的大表格的查询证明。

顺着这个思路往下想，一般情况下表格不可能是稀疏的，不过非稀疏的表格在某些情况下是可以分解的。比如我们在前文提到的异或运算的表格，

$i 01 ⋮ 15 A ∥ B 00 ∥ 00 00 ∥ 01 ⋮ 11 ∥ 11 A \oplus B 0001 ⋮ 00$

直觉上，一个2-bit XOR 表格是可以分解为两个 1-bit XOR 表格的运算。因为 XOR 运算是按位进行，操作数的高位和低位的 XOR 运算互不干扰。进而我们可以推广到 AND 运算，OR 运算等等。具体怎么做到呢？接下去，我们深入到表格的内部结构中。

2. 分解表格

稀疏的选择矩阵 $M$ 还有一个特点是，其中的所有非零元素都为 $1$ 。那么我们可以换一种方式来表达 Lookup 等式：

$f (X) = i = 0 \sum m - 1 T [col (i)] \cdot e q_{i} (X)$

为了排版清晰，这里我们换用大写的 $T$ 表示未被分解的大表格，分解出的子表格用小写字母 $t$ 表示，并且用 $T [i]$ 和 $t [i]$ 符号来表示表格中第 $i$ 个元素 $t_{i}$ 。其中 $col (i)$ 表示第 $i$ 行的 $1$ 所在的列坐标，可以看成是 $M$ 矩阵的一种稠密表示。容易验证对任意的 $i \in [0, m)$ ， $T [col (i)] = f_{i}$ ，相当于列出表格中的被 $M$ 非零元素筛选出来的元素。因此这个等式可以看成 $\tilde{f} (X)$ 的另一种定义，等价于

$f (X) = y \in {0, 1}^{l o g N} \sum M (X, y) \cdot \tilde{t} (y)$

我们把 $T [col (i)]$ 单独排成一个向量 $h$ ，然后把向量编码成 MLE 多项式，记为 $\tilde{h} (X)$ 。那么通过一个随机挑战向量 $r$ ， Lookup 的关系就归约到下面的等式:

$f (r) = ? i \in [0, m) \sum h_{i} \cdot e q_{i} (r)$

根据 Offline Memory Checking 的思路，我们可以证明 $h_{i}$ 都读取自表格 $T$ 。这样相当于原地踏步，我们为了证明一个 Lookup关系，我们归约到了另一个 Lookup 关系。不过我们是否可以 $h_{i}$ 分解到一个二维（或者多维）的子表格上呢？就像 Spark 协议中的 $e$ 向量一样，我们是把 $e$ 所读取的内存 $λ$ 分解成了 $λ^{(x)}$ 和 $λ^{(y)}$ ，然后把 $e$ 分解为 $e^{(x)}$ 和 $e^{(y)}$ 。然而并不是所有的表格都能像 $λ$ 一样满足 Tensor Structure 的。事实上，绝大部分的表格不满足这个条件。不过幸运地是，尽管他们不满足 Tensor Structure，但是一大类的有用表格可以按照类似的思路处理。

我们先看一个简单但很实用的表格，RangeCheck 表格。当需要证明 $0 \leq x < 2^{k}$ ，我们可以构造一个表格 $T_{range, k} = (0, 1, \dots, 2^{k} - 1)$ ，如果 $x \in T_{range, k}$ ，那么说明 $x$ 在 $0$ 到 $2^{k} - 1$ 之间。

这个表格 $T_{range, k}$ 可以被分解成两个 $2^{k /2}$ 的 RangeCheck 表格之间的运算:

$T_{range, k} [i \cdot 2^{k /2} + j] = t_{range, k/2} [i] \cdot 2^{k /2} + t_{range, k/2} [j]$

比如我们假设 $k = 4$ ， $T_{range, 4}$ 定义如下：

$T_{range, 4} = (0, 1, 2, 3, \dots, 15)$

另一个 2-bit RangeCheck 表格 $t_{range, 2}$ 定义如下：

$t_{range, 2} = (0, 1, 2, 3)$

那么我们可以用下面的矩阵来展示 $T_{range, 4}$ 和子表格 $t_{range, 2}$ 之间的关系：

$0 \cdot 2^{2} = 0 1 \cdot 2^{2} = 4 2 \cdot 2^{2} = 8 3 \cdot 2^{2} = 12 00481211591322610143371115$

矩阵的第一行为 $t^{(x)} = t_{range, 2}$ ，第一列也为 $t^{(y)} = t_{range, 2}$ ，矩阵中的每个单元可以表示为

$T_{range, 4} [i, j] = 2^{2} \cdot t^{(x)} [i] + t^{(y)} [j]$

于是矩阵的所有单元构成了 $T_{range, 4}$ 的所有元素。

针对 Rangecheck 表格这个特例，我们可以构造一个高效的 Lookup Argument。

3. RangeCheck 表格的 Lookup Argument

我们用 $t_{range2} (X)$ 和 $T_{range4} (X)$ 表示 2bit 和 4bit-RangeCheck 表格的 MLE 多项式，那么它们满足下面的等式：

$T_{range4} (X_{0}, X_{1}, X_{2}, X_{3}) = 4 \cdot t_{range2} (X_{0}, X_{1}) + \tilde{t}_{range2} (X_{2}, X_{3})$

那么 Lookup 关系可以写成下面的形式：

$f (r_{0}, r_{1}, r_{2}, r_{3}) = i \in [0, m) \sum T_{range4} (bits (col (i))) \cdot e q_{i} (r_{0}, r_{1}, r_{2}, r_{3}) = i \in [0, m) \sum (4 \cdot t_{range2} (bits^{(hi)} (col (i))) + t_{range2} (bits^{(l o)} (col (i)))) \cdot e q_{i} (r_{0}, r_{1}, r_{2}, r_{3})$

这里 $bits^{(hi)} (col (i))$ 和 $bits^{(l o)} (col (i))$ 分别表示 $col (i)$ 的高 2bits 和低 2bits。

同样，我们需要借助向量 $e$ ，其中向量元素 $e_{i}$ 表示 $\tilde{T}_{range4}$ 在 $bits (col (i)), i \in [0, m)$ 处的取值，因此上面的等式可以转化为：

$f (r_{0}, r_{1}, r_{2}, r_{3}) = i \in [0, m) \sum e_{i} \cdot e q_{i} (r_{0}, r_{1}, r_{2}, r_{3})$

由于 $\tilde{T}_{range4}$ 的可分解性，我们可以把 $e_{i}$ 的高 2bits 和低 2bits 分别抽取出来，它们构成两个向量 $e^{(x)}$ 与 $e^{(y)}$ ，分别对应 $t_{range2}$ 中的第 $i_{0}$ 项和第 $i_{1}$ 项，满足 $i = 4 \cdot i_{0} + i_{1}$ 。

接下来构造 $e^{(x)}$ 与 $e^{(y)}$ 两个 MLE 多项式，分别编码 $e^{(x)}$ 与 $e^{(y)}$ ，那么上面的等式可以转化为：

$f (r_{0}, r_{1}, r_{2}, r_{3}) = b \in {0, 1}^{l o g m} \sum (4 \cdot e^{(x)} (b) + e^{(y)} (b)) \cdot e q (b, (r_{0}, r_{1}, r_{2}, r_{3}))$

由于这个等式是一个求和式，因此我们可以利用 Sumcheck 协议来把上面的等式归约到：

$v^{'} = (4 \cdot e^{(x)} (ρ) + e^{(y)} (ρ)) \cdot \tilde{e q} (ρ, (r_{0}, r_{1}, r_{2}, r_{3}))$

其中 $ρ$ 为 Verifier 在 Sumcheck 过程中产生的长度为 $lo g m$ 的挑战向量。辅助向量 $e^{(x)}$ 与 $e^{(y)}$ 的正确性可以由 Offline Memory Checking 来证明。

类似的，我们可以把 32-bit RangeCheck 表格分解成四个 8-bit RangeCheck 表格，或者两个 16-bit RangeCheck 表格。

我们用这个可分解表格，构造一个 Lookup Argument，与之前的方案的差异在于，它利用了表格向量的内部结构，可以处理超大的表格。

4. Lasso 协议框架

Lasso 的核心协议是一个类似 Spark 的稀疏多项式承诺，被称为 Surge。对于任意一个查找记录 $f_{i}$ ，假如 $f_{i}$ 在主表格 $T$ 中的索引值为 $a_{i}$ 。因为主表格 $T$ 可被分解，比如 $T$ 可以被分解为 $c$ 个子表格。分解维度的数量 $c$ 对应于主表的索引值 $i$ 按照二进制位的拆分。例如：

$bits (i) = dim^{(0)} (i) ∥ dim^{(1)} (i) ∥ \dots ∥ dim^{(c - 1)} (i)$

即每一个主表元素 $T_{i}$ 都可以写成关于 $c$ 个子表格 $(t^{(0)}, t^{(1)}, \dots, t^{(c - 1)})$ 中的元素的运算：

$T_{i} = G (t^{(0)} [dim^{(0)} (i)], t^{(1)} [dim^{(1)} (i)], \dots, t^{(c - 1)} [dim^{(c - 1)} (i)])$

我们可以写下对于可分解表格的 Lookup Argument 的等式：

$f (X) = ? b \in {0, 1}^{l o g m} \sum G (t^{(0)} [dim^{(0)} (b)], t^{(1)} [dim^{(1)} (b)], \dots, t^{(c - 1)} [dim^{(c - 1)} (b)]) \cdot e q (b, X)$

以 32-bit 的 Rangcheck 表格为例，假如我们需要把它分解为四个子表格，这四个子表格完全一摸一样，都是一个 8-bit 的 Rangecheck 表格。那么我们可以写下下面的等式：

$T_{range, 32} [(i_{0}, i_{1}, i_{2}, i_{3})_{(2)}] = 2^{24} \cdot t_{range, 8} [i_{0}] + 2^{16} \cdot t_{range, 8} [i_{1}] + 2^{8} \cdot t_{range, 8} [i_{2}] + t_{range, 8} [i_{3}]$

这里 $G (\cdot)$ 的定义如下

$G (y_{0}, y_{1}, y_{2}, y_{3}) = 2^{24} \cdot y_{0} + 2^{16} \cdot y_{1} + 2^{8} \cdot y_{2} + y_{3}$

协议细节

公共输入：

子表格的承诺： ${cm (\tilde{t}^{(i)} (X))}_{i \in [c]}$
查询向量的承诺： $cm (\tilde{f} (X))$

第一轮：Prover 计算并承诺 ${\tilde{dim}^{(i)} (X)}_{i \in [c]}$

第二轮：Verifier 发送随机向量 $r \in F^{l o g m}$

第三轮：Prover 计算向量 $e^{(0)}, e^{(1)}, \dots, e^{(c - 1)}$

$e_{j}^{(i)} = t^{(i)} [dim^{(i)} (bits (j))], \forall j \in [0, m), \forall i \in [0, c)$

Prover 计算计数器向量（长度为 $lo g m$ ） $c^{(0)}, c^{(1)}, \dots, c^{(c - 1)}$ ，

Prover 计算终状态中的计数器向量（长度为 $lo g N / c$ ） $s^{(0)}, s^{(1)}, \dots, s^{(c - 1)}$

Prover 发送向量的承诺 $cm (e^{(0)}), cm (e^{(1)}), \dots, cm (e^{(c - 1)})$

第四轮：Prover 和 Verifier 运行 Sumcheck 协议，证明下面的等式：

$v = ? b \in {0, 1}^{l o g m} \sum G (e^{(0)} (b), e^{(1)} (b), \dots, e^{(c - 1)} (b)) \cdot e q (b, r)$

Prover 和 Verifier 把等式归约到：

$v^{'} = G (e^{(0)} (ρ), e^{(1)} (ρ), \dots, e^{(c - 1)} (ρ)) \cdot e q (ρ, r)$

第五轮：Prover 发送 $(v_{e, 0}, v_{e, 1}, \dots, v_{e, c - 1})$ ，以及 $(π_{e, 0}, π_{e, 1}, \dots, π_{e, c - 1})$

$v_{e, i} = \tilde{e}^{(i)} (ρ), \forall i \in [0, c)$
$π_{e, i} = PCS.Eval (E^{(i)}, ρ, v_{e, i}; e^{(i)}), \forall i \in [0, c)$

第六轮：Verifier 验证

$PCS.Verify (cm (e^{(i)}), ρ, v_{e, i}, π_{e, i}) = 1, \forall i \in [0, c)$

$v^{'} = ? G (v_{e, 0}, v_{e, 1}, \dots, v_{e, c - 1}) \cdot \tilde{e q} (ρ, r)$

第七轮：Prover 和 Verifier 调用 Offline Memory Checking 证明每个 $e^{(i)}$ 的正确性，即每个向量元素 $e_{j} \in e^{(i)}$ 都是从表格 $t^{(i)}$ 中读取，读取的位置为 $dim^{(i)} (bits (j))$ ：

$e^{(i)} = (t^{(i)} [dim^{(i)} (bits (0))], t^{(i)} [dim^{(i)} (bits (1))], \dots, t^{(i)} [dim^{(i)} (bits (m - 1))]), \forall i \in [0, c)$

5. 二元操作表格的分解

除了 RangeCheck 表格之外，还有 AND, OR, XOR 这类按位计算表格也可以按照同样的思路进行分解。例如下面是一个 1-bit AND 表，记为 $AND^{(1)}$ ：

$i 0123 A ∥ B 0 ∥ 0 0 ∥ 1 1 ∥ 0 1 ∥ 1 A & B 0001$

可以看出，这个表格有 4 行，第 $i$ 行的表格元素为 $A & B$ ，而表格的索引值的高位为 $A$ ，低位为 $B$ 。比如 $i = 2$ 这一行， $i = (10)_{(2)}$ 二进制位的高位为 $1$ ，低位为 $0$ ，那么这一行的表格元素为 $0$ ，表示 $1&0 = 0$ 。假设我们要分解一个 2-bit AND 表格， $AND^{(2)}$ , 那么我们可以用下面的矩阵来表示：

$0001000000010000000010000000010101010111$

矩阵中的每个单元格表示 $(A_{0}, A_{1}) & (B_{0}, B_{1})$ ，其中 $A_{0} & B_{0} = T_{and, 1} [(A_{0}, B_{0})]$ ， $A_{1} & B_{1} = T_{and, 1} [(A_{1}, B_{1})]$ 满足下面的等式：

$AND^{(2)} [(A_{0}, A_{1}, B_{0}, B_{1})_{(2)}] = 2 \cdot AN D^{(1)} [(A_{0}, B_{0})] + AN D^{(1)} [(A_{1}, B_{1})]$

因此，我们可以推而广之，对于任意的 $W$ -bit AND 表格，我们可以把操作数 $A$ 和 $B$ 按位拆分成 $c$ 段，每一段查子表格 $AND^{(W / c)}$ 确定 $A_{i} & B_{i}$ ，然后将 $c$ 个运算结果再按位拼装起来。下面写出这个关系等式：

$AND^{(W)} (X_{0} ∥ X_{1} ∥ \dots ∥ X_{c - 1}, Y_{0} ∥ Y_{1} ∥ \dots ∥ Y_{c - 1}) = 2^{c - 1} \cdot AND^{(W / c)} (X_{0}, Y_{0}) + 2^{c - 2} \cdot AND^{(W / c)} (X_{1}, Y_{1}) + \dots + AND^{(W / c)} (X_{c - 1}, Y_{c - 1})$

代入到 Lookup 关系等式中，我们可以得到：

$f (X, Y) = ? a, b \in {0, 1}^{l o g m} \sum G_{AND} (AND^{(W / c)} [dim_{0} (a), dim_{0} (b)], \dots, AND^{(W / c)} [dim_{c - 1} (a), dim_{c - 1} (b)]) \cdot e q ((a, b), (X, Y))$

代入上面的 Lasso 协议，我们可以构造出对 $AND^{(W)}$ 表格的 Lookup Arugment 方案。

同样我们可以把其它的二元位操作同样按照这样的思路去分解，如 $OR$ 与 $XOR$ 。把主表格拆分成 $c$ 段，假设主表格表示两个长度为 $W$ 的二进制数的位运算，那么第 $i$ 个子表格对应主表索引的第 $i \cdot (W / c)$ 位到 $(i + 1) \cdot (W / c)$ 之间的位运算。 $(dim_{i} (a), dim_{i} (b))$ 表示两个操作数 $X$ 和 $Y$ 的二进制位在主表格第 $i$ 个维度上的位置索引。

References

[Spartan] Spartan: Efficient and general-purpose zkSNARKs without trusted setup by Srinath Setty.
[Lasso] Unlocking the lookup singularity with Lasso by Srinath Setty, Justin Thaler and Riad Wahby.
[Jolt] Jolt: SNARKs for Virtual Machines via Lookups by Arasu Arun, Srinath Setty and Justin Thaler.
[Baloo] Baloo: Nearly Optimal Lookup Arguments by Arantxa Zapico, Ariel Gabizon, Dmitry Khovratovich, Mary Maller and Carla Ràfols.

理解 Lasso (四)：更多的可分解表格

作者: Yu Guo@Secbit(郭宇): Founder of Secbit, https://github.com/sec-bit

Jolt 论文给出了更多的可分解表格，用于表达 RISC-V 指令的计算过程。

理解 Lasso (五)：表格的 MLE 结构

作者: Yu Guo@Secbit(郭宇): Founder of Secbit, https://github.com/sec-bit

本文介绍 Generalized Lasso，也是 [Lasso] 论文的关键部分之一。与 Lasso 相比，Generalized Lasso 不再对大表格进行拆分，而是把表格作为整体进行证明。为了处理超大尺寸表格，Generalized Lasso 需要要求表格中的每一项是可以通过其 Index 的二进制表示进行计算得到。对于尺寸为 $N$ 的超大表格而言，其 Index 的二进制位数量为 $lo g N$ ，因此表格的表项的计算复杂度一定为 $O (lo g N)$ 。

这样做的一个优势是，Prover 可以不必要对表格进行承诺计算，当 Verifier 挑战表格编码的多项式时，Verifier 可以自行计算挑战点的多项式求值，因为这个运算复杂度仅为 $O (lo g N)$ 。这样 Prover 可以节省大量的计算时间。

1. 什么是 MLE-Structured

按照 [Lasso] 论文的定义，MLE-structured 是指任何 MLE 多项式 $\tilde{t} (X)$ 可以在 $O (lo g N)$ 时间的计算复杂度内完成求值运算。这里 $N$ 为 $2^{s}$ ， $s$ 为多项式未知数的个数。

哪些表格具有这种 MLE-structured 的性质呢？下面给出一些常用的例子：

Range check 表格， $t_{i} \in [0, N)$ 。
连续偶数或者奇数构成的表格， $t_{i} = 2 k, t_{i} \in [0, N)$
Spread 表格。一种在数字二进制表示的相邻两位插入 0 的表格，例如，对于 $i = 0110$ ， $t_{i} = 00101000$ 。这种表格用来加速实现位运算。

2. Generalized Lasso

Generalized Lasso 可以构造针对 MLE-Structured 表格的 Indexed Lookup Argument。其核心是证明下面的等式：

$f (X) = y \in {0, 1}^{l o g N} \sum M (X, y) \cdot \tilde{t} (y)$

这里 $f$ 为查询向量，长度为 $m$ ； $t$ 为表格向量，长度为 $N$ ； $M \in F^{m \times N}$ 为表格选择矩阵，其中每一行是一个 Unit Vector。而 MLE 多项式 $f (X_{0}, X_{1}, \dots, X_{l o g m - 1})$ 编码了 $f$ ， $t (Y_{0}, Y_{1}, \dots, Y_{l o g N - 1})$ 编码了 $t$ ，而 $\tilde{M} (X_{0}, X_{1}, \dots, X_{l o g m - 1}, Y_{0}, Y_{1}, \dots, Y_{l o g N - 1})$ 编码了 $M$ 矩阵。

Prover 和 Verifier 需要证明每一个 $f_{i}$ 等于某个表项 $t_{j}$ 。他们共同拥有的 Public Inputs 为表格向量与查询向量的多项式承诺，因为我们现在只关注 Indexed Lookup Argument，因此他们还共同拥有 $M$ 的多项式承诺。

协议的第一步是 Verifier 发送一个挑战向量 $r \in F^{m}$ ，使得上面的约束转化为：

$f (r) = y \in {0, 1}^{l o g N} \sum M (r, y) \cdot \tilde{t} (y)$

Verifier 可以通过查询 Oracle $f$ 来得到 $f (r)$ 的值，我们记为 $v$ 。于是上面的等式就归约到了一个求和式：

$v = y \in {0, 1}^{l o g N} \sum M (r, y) \cdot t (y)$

此刻，Prover 和 Verifier 可以调用 Sumcheck 协议来完成求和式的证明。但是 Prover 需要计算 $N$ 个 $M (r, y) \cdot t (y)$ 的值。

在 Sumcheck 协议的结尾，Prover 和 Verifier 可以利用多项式承诺的求值证明，证明 $M (r, Y)$ 和 $t (Y)$ 在 $Y = ρ$ 处的求值。尽管我们可以使用 Spark 稀疏多项式承诺来降低最后的求值证明的开销，但是 Prover 在 Sumcheck 协议过程中的计算量至少是 $O (m \cdot N)$ 。

下一节我们介绍 Generalized Lasso 如何再次利用 $M$ 矩阵的稀疏性，减少 Prover 在 Sumcheck 协议中的计算量。在此之前，我们先列出 Generalized Lasso 的协议框架：

协议框架

公共输入：

表格向量 $t$ 的承诺： $C_{t} = PCS.Commit (t)$
查询向量 $f$ 的承诺： $C_{f} = PCS.Commit (f)$
表格选择矩阵 $M$ 的承诺： $C_{M}^{spark} = Spark.Commit (M)$

第一轮：Verifier 发送挑战向量 $r \in F^{l o g m}$

第二轮：Prover 计算 $\tilde{f} (r)$ 的值，并且连同求值证明 $π_{f}$ 一起发送给 Verifier

第三轮：Prover 和 Verifier 进行 Sparse-dense Sumcheck 协议，证明下面的等式：

$v = y \in {0, 1}^{l o g N} \sum M (r, y) \cdot t (y)$

经过 Sumcheck 协议，上面的约束等式被归约到：

$v^{'} = M (r, ρ) \cdot t (ρ)$

第四轮：Prover 发送 $v_{M}, v_{t}$ 与求值证明 $π_{M}, π_{t}$ 给 Verifier

$v_{M} = \tilde{M} (r, ρ)$
$v_{t} = \tilde{t} (ρ)$

第五轮：Verifier 验证下面的等式：

$v^{'} = ? v_{M} \cdot v_{t}$
$PCS.Verify (C_{t}, v_{t}, π_{t}) = ? 1$
$PCS.Verify (C_{f}, v, π_{f}) = ? 1$
$Spark.Verify (C_{M}^{spark}, v_{M}, π_{M}) = ? 1$

3. Simplified Sparse-dense Sumcheck

这一节，我们分析下 Prover 在 Sumcheck 协议中的开销，以及如何利用 $M$ 的稀疏性质来减少 Prover 的计算量。

再重复下 Sumcheck 要证明的求和等式：

$v = b \in {0, 1}^{l o g N} \sum u (b) \cdot t (b)$

这里我们用 $u (b)$ 代替 $M (r, b)$ ，它是一个稀疏的多项式，只有 $m$ 个非零项。而 $\tilde{t} (b)$ 是一个 MLE-structured 的多项式，它的计算复杂度为 $O (lo g N)$ 。

Sumcheck 协议总共 $lo g N$ 轮，在每一轮，Prover 主要的计算量为计算一个一元多项式并发送给 Verifier：

注意到这个一元多项式 $h^{(j)} (X)$ 是 $O (N)$ 个项的求和，但是 $u (b)$ 是一个稀疏的 MLE 多项式。如果 $u (X)$ 在 $X = y$ 处的取值为零，那么 Prover 也就可以省去计算 $\tilde{t} (y)$ 的开销。因此，Prover 实际上只需要计算 $O (m)$ 个项的求和，而不是 $O (N)$ 个项。

进一步展开 $\tilde{u} (b)$ 的定义，我们可以得到：

$u (b_{0}, b_{1}, \dots, b_{l o g N - 1}) = i \in S_{u} \sum u_{i} \cdot e q_{i} (b_{0}, b_{1}, \dots, b_{l o g N - 1})$

其中 $S_{u}$ 定义为 $u$ 中非零项的索引集合。因此 $h^{(j)} (X)$ 求和式可以进一步简化为 $m$ 项的求和：

$h^{(j)} (X) = (b_{j + 1}, b_{j + 2}, \dots, b_{l o g N}) \in {0, 1}^{l o g N - j - 1} \sum u (r_{0}, r_{1}, \dots, r_{j - 1}, X, b_{j + 1}, b_{j + 2}, \dots, b_{l o g N - 1}) \cdot t (r_{0}, r_{1}, \dots, r_{j - 1}, X, b_{j + 1}, b_{j + 2}, \dots, b_{l o g N - 1}) = i \in S_{u} \sum u_{i} \cdot (b_{j + 1}, b_{j + 2}, \dots, b_{l o g N}) \in {0, 1}^{l o g N - j - 1} \sum e q_{i} (r_{0}, r_{1}, \dots, r_{j - 1}, X, b_{j + 1}, b_{j + 2}, \dots, b_{l o g N - 1}) \cdot t (r_{0}, r_{1}, \dots, r_{j - 1}, X, b_{j + 1}, b_{j + 2}, \dots, b_{l o g N - 1}) = i \in S_{u} \sum u_{i} \cdot e q_{i} (r_{0}, r_{1}, \dots, r_{j - 1}, X, i_{j + 1}, i_{j + 2}, \dots, i_{l o g N - 1}) \cdot t (r_{0}, r_{1}, \dots, r_{j - 1}, X, i_{j + 1}, i_{j + 2}, \dots, i_{l o g N - 1})$

每一轮，假设当前我们在第 $j$ 轮，Prover 要计算 $m$ 个项的求和，每一项包含两个乘法和两个 MLE 多项式的求值，分别为 $e q_{i}$ 和 $t$ 。接着 Verifier 都会提供一个随机数 $r_{j}$ 来求值 $h^{(j)} (X)$ ，然后 Sumcheck 进入下一轮，即第 $j + 1$ 轮。

在第 $j$ 轮， Prover 的策略是根据上一轮（第 $j - 1$ 轮）的 $e q_{i} (\dots, r_{j - 1}, i_{j}, \dots)$ 和 $t (\dots, r_{j - 1}, i_{j}, \dots)$ 的求值来增量式的递推计算 $e q_{i} (\dots, r_{j - 1}, r_{j}, \dots)$ 和 $t (\dots, r_{j - 1}, r_{j}, \dots)$ ，即用 $r_{j}$ 来代替 $i_{j}$ 。

然后我们观察下 $\tilde{e q}_{i} (r_{0}, r_{1}, \dots, r_{j - 1}, X, i_{j + 1}, i_{j + 2}, \dots, i_{l o g N - 1})$ 的定义，

$\tilde{e q}_{i} (r_{0}, r_{1}, \dots, r_{j - 1}, X, i_{j + 1}, i_{j + 2}, \dots, i_{l o g N - 1}) = (k = 0 \prod j - 1 (1 - i_{k}) \cdot (1 - r_{k}) + i_{k} \cdot r_{k}) \cdot ((1 - X) \cdot (1 - i_{j}) + X \cdot i_{j}) \cdot (k = j + 1 \prod l o g N - 1 (1 - i_{k}) (1 - i_{k}) + i_{k} \cdot i_{k})$

注意到等式右边的三个乘积因子中的最右边一个恒等于 1。如果 $X = i_{j}$ ，

$\tilde{e q}_{i} (r_{0}, r_{1}, \dots, r_{j - 1}, i_{j}, i_{j + 1}, i_{j + 2}, \dots, i_{l o g N - 1}) = k = 0 \prod j - 1 (1 - i_{k}) \cdot (1 - r_{k}) + i_{k} \cdot r_{k}$

那么当我们用 $r_{j}$ 来代替 $i_{j}$ 时，

$e q_{i} (r_{0}, r_{1}, \dots, r_{j - 1}, r_{j}, i_{j + 1}, i_{j + 2}, \dots, i_{l o g N - 1}) = (k = 0 \prod j - 1 (1 - i_{k}) \cdot (1 - r_{k}) + i_{k} \cdot r_{k}) \cdot ((1 - r_{j}) \cdot (1 - i_{j}) + r_{j} \cdot i_{j}) = e q_{i} (r_{0}, r_{1}, \dots, r_{j - 1}, i_{j}, i_{j + 1}, i_{j + 2}, \dots, i_{l o g N - 1}) \cdot ((1 - r_{j}) \cdot (1 - i_{j}) + r_{j} \cdot i_{j})$

因此，根据 $i_{j}$ 是 $0$ 还是 $1$ ，Prover 可以仅用一个乘法即可递推地计算出第 $j + 1$ 轮所需要的 $e q_{i}$ 。又因为总共有 $m$ 个 $e q_{i}$ 需要计算，所以 Prover 要付出 $O (m)$ 的计算量。

Prover 可以维护一个长度为 $m$ 的数组，里面保存 $\tilde{e q}_{i}$ 的值，每一轮过后就更新这个数组：

$e q_{i} (r_{0}, r_{1}, \dots, r_{j - 1}, r_{j}, i_{j + 1}, i_{j + 2}, \dots, i_{l o g N - 1}) = {e q_{i} (r_{0}, r_{1}, \dots, r_{j - 1}, i_{j}, i_{j + 1}, i_{j + 2}, \dots, i_{l o g N - 1}) \cdot (1 - r_{j}) \tilde{e q}_{i} (r_{0}, r_{1}, \dots, r_{j - 1}, i_{j}, i_{j + 1}, i_{j + 2}, \dots, i_{l o g N - 1}) \cdot r_{j} if i_{j} = 0 if i_{j} = 1$

但是对于 $t (r_{0}, r_{1}, \dots, r_{j - 1}, X, i_{j + 1}, i_{j + 2}, \dots, i_{l o g N - 1})$ 这个求值运算，如果 $t$ 没有内部结构，那么 Prover 需要老老实实进行求值运算。这样每一轮中 Prover 仍然需要执行 $m$ 次 MLE 运算求值过程。在 $lo g N$ 轮的 Sumcheck 协议过程中，Prover 总共的计算量至少为

$O (m \cdot lo g N \cdot evaltime (\tilde{t}))$

如果 $t$ 恰好具有 MLE-Structured 性质，那么 $evaltime (\tilde{t})$ 为 $O (lo g N)$ ，那么 Prover 的计算量为 $O (m \cdot lo g^{2} N)$ 。

进一步，如果 $t$ 具有「局部 bit 相关」的特性，即我们可以采用计算 $e q_{i}$ 的方法给出 $t$ 的递推计算式：

$t (r_{0}, \dots, r_{j - 1}, X, b_{j + 1}, \dots, b_{l o g N - 1}) = m (X, j, b_{j}) \cdot t (r_{0}, \dots, r_{j - 1}, b_{j}, b_{j + 1}, \dots, b_{l o g N - 1}) + a (X, j, b_{j})$

这里 $m_{l} (X, j, b_{j})$ 和 $a_{l} (X, j, b_{j})$ 是两个多项式，他们的计算复杂度为 $O (1)$ 。如果 $t$ 的递推计算能满足上面的等式，那么 Prover 就可以同样维护一个长度为 $m$ 的数组，保存 $i \in S_{u}$ 所对应的 $t (r_{0}, \dots, r_{j - 1}, r_{j}, i_{j + 1}, \dots, i_{l o g N - 1})$ 的值。这样 Prover 可以在每一轮中只需要总共 $O (m)$ 的计算量来计算更新所有需要用到的 $\tilde{t}$ 的值。

这样一来， Prover 的计算量可以进一步降低为 $O (m \cdot lo g N)$ 。

下面举一个简单例子，来演示下整个过程。假设 $N = 8$ ，一个稀疏的向量 $u = (0, u_{1}, u_{2}, 0, u_{4}, 0, 0, 0)$ ，表格向量 $t = (t_{0}, t_{1}, t_{2}, t_{3}, t_{4}, t_{5}, t_{6}, t_{7})$ 。稀疏向量的非零值数量为 $m = 3$ ， $S_{u} = (1, 2, 4)$ 。

Sumcheck 协议要证明的求和式为：

$v = b \in {0, 1}^{3} \sum u (b) \cdot t (b) = u_{1} \cdot t_{1} + u_{2} \cdot t_{2} + u_{4} \cdot t_{4}$

Prover 预计算 $E^{(0)} (i) = e q_{i} (i_{0}, \dots, i_{l o g N - 1})$ 的值为 1， $T^{(0)} (i) = t (i_{0}, \dots, i_{l o g N - 1}) = t_{i}$

在第 0 轮中，Prover 计算 $h^{(1)} (X)$ ：

$h^{(1)} (X) = b_{2}, b_{3} \in {0, 1} \sum u (X, b_{2}, b_{3}) \cdot t (X, b_{2}, b_{3}) = u_{1} \cdot E^{(0)} (1) \cdot t (X, 0, 1) \cdot (1 - X) + u_{2} \cdot E^{(0)} (2) \cdot t (X, 1, 0) \cdot (1 - X) + u_{4} \cdot E^{(0)} (4) \cdot t (X, 0, 0) \cdot X = u_{1} \cdot E^{(0)} (1) \cdot (m (X, j = 0, b_{0} = 0) \cdot t (b_{0} = 0, b_{1} = 0, b_{2} = 1) + a (X, j = 0, b_{0} = 0)) \cdot (1 - X) + u_{2} \cdot E^{(0)} (2) \cdot (m (X, j = 0, b_{0} = 0) \cdot t (b_{0} = 0, b_{1} = 1, b_{2} = 0) + a (X, j = 0, b_{0} = 0)) \cdot (1 - X) + u_{4} \cdot E^{(0)} (4) \cdot (m (X, j = 0, b_{0} = 1) \cdot t (b_{0} = 1, b_{1} = 0, b_{2} = 0) + a (X, j = 0, b_{0} = 1)) \cdot X = u_{1} \cdot E^{(0)} (1) \cdot (m (X, j = 0, b_{0} = 0) \cdot T^{(0)} (1) + a (X, j = 0, b_{0} = 0)) \cdot (1 - X) + u_{2} \cdot E^{(0)} (2) \cdot (m (X, j = 0, b_{0} = 0) \cdot T^{(0)} (2) + a (X, j = 0, b_{0} = 0)) \cdot (1 - X) + u_{4} \cdot E^{(0)} (4) \cdot (m (X, j = 0, b_{0} = 1) \cdot T^{(0)} (4) + a (X, j = 0, b_{0} = 1)) \cdot X$

可以看出，Prover 只需要计算 $m (X, 0, 0)$ ， $m (X, 0, 1)$ ， $a (X, 0, 0)$ ， $a (X, 0, 1)$ 这四个多项式的值。而这四个多项式的计算量为 $O (1)$ 。Prover 发送 $(h^{(1)} (0)), h^{(1)} (1), h^{(1)} (2))$ 作为 $h^{(1)} (X)$ 的点值形式发送。

Verifier 发送挑战数 $r_{0}$ ，Prover 和 Verifier 检查

$v = ? h^{(1)} (0) + h^{(1)} (1)$

然后共同计算 $h^{(1)} (r_{0})$ 作为新的求和。

Prover 更新 $E (i)$ 与 $T (i)$ 到 $E^{(1)}$ 与 $T^{(1)}$ ，

$E^{(1)} (1) E^{(1)} (2) E^{(1)} (4) = E^{(0)} (1) \cdot (1 - r_{0}) = (1 - r_{0}) = E^{(0)} (2) \cdot (1 - r_{0}) = (1 - r_{0}) = E^{(0)} (4) \cdot r_{0} = r_{0}$

$T^{(1)} (1) T^{(1)} (2) T^{(1)} (4) = m (r_{0}, 0, 0) \cdot T^{(0)} (1) + a (r_{0}, 0, 0) = m (r_{0}, 0, 0) \cdot T^{(0)} (2) + a (r_{0}, 0, 0) = m (r_{0}, 0, 1) \cdot T^{(0)} (4) + a (r_{0}, 0, 1)$

下面是第二轮，Prover 计算 $h^{(2)} (X)$ ：

$h^{(2)} (X) = b_{3} \in {0, 1} \sum u (r_{0}, X, b_{3}) \cdot t (r_{0}, X, b_{3}) = u_{1} \cdot E^{(1)} (1) \cdot t (r_{0}, X, 1) \cdot (1 - X) + u_{2} \cdot E^{(1)} (2) \cdot t (r_{0}, X, 0) \cdot X + u_{4} \cdot E^{(1)} (4) \cdot t (r_{0}, X, 0) \cdot (1 - X) = u_{1} \cdot E^{(1)} (1) \cdot (m (X, j = 1, b_{1} = 0) \cdot t (r_{0}, b_{1} = 0, b_{2} = 1) + a (X, j = 1, b_{1} = 0)) \cdot (1 - X) + u_{2} \cdot E^{(1)} (2) \cdot (m (X, j = 1, b_{1} = 1) \cdot t (r_{0}, b_{1} = 1, b_{2} = 0) + a (X, j = 1, b_{1} = 1)) \cdot X + u_{4} \cdot E^{(1)} (4) \cdot (m (X, j = 1, b_{1} = 0) \cdot t (r_{0}, b_{1} = 0, b_{2} = 0) + a (X, j = 1, b_{1} = 0)) \cdot (1 - X) = u_{1} \cdot E^{(1)} (1) \cdot (m (X, j = 1, b_{0} = 0) \cdot T^{(1)} (1) + a (X, j = 1, b_{1} = 0)) \cdot (1 - X) + u_{2} \cdot E^{(1)} (2) \cdot (m (X, j = 1, b_{0} = 1) \cdot T^{(1)} (2) + a (X, j = 1, b_{1} = 1)) \cdot X + u_{4} \cdot E^{(1)} (4) \cdot (m (X, j = 1, b_{0} = 0) \cdot T^{(1)} (4) + a (X, j = 1, b_{1} = 0)) \cdot (1 - X)$

Prover 只需要计算 $m (X, 1, 0)$ ， $m (X, 1, 1)$ ， $a (X, 1, 0)$ ， $a (X, 1, 1)$ 这四个多项式的值。而这四个多项式的计算量为 $O (1)$ 。Prover 发送 $(h^{(2)} (0)), h^{(2)} (1), h^{(2)} (2))$ 作为 $h^{(2)} (X)$ 的点值形式发送。

Verifier 发送挑战数 $r_{1}$ ，Prover 和 Verifier 检查

$h^{(1)} (r_{1}) = ? h^{(2)} (0) + h^{(2)} (1)$

Prover 维护 $E$ 与 $T$ 数组，更新到 $E^{(2)}$ 与 $T^{(2)}$ ，

$E^{(2)} (1) E^{(2)} (2) E^{(2)} (4) = E^{(1)} (1) \cdot (1 - r_{1}) = E^{(1)} (2) \cdot r_{1} = E^{(1)} (4) \cdot (1 - r_{1}) = (1 - r_{0}) \cdot (1 - r_{1}) = (1 - r_{0}) \cdot r_{1} = r_{0} \cdot (1 - r_{1})$

$T^{(2)} (1) T^{(2)} (2) T^{(2)} (4) = m (r_{1}, 1, 0) \cdot T^{(1)} (1) + a (r_{1}, 1, 0) = m (r_{1}, 1, 1) \cdot T^{(1)} (2) + a (r_{1}, 1, 1) = m (r_{1}, 1, 0) \cdot T^{(1)} (4) + a (r_{1}, 1, 0)$

到了第三轮，Prover 计算 $h^{(3)} (X)$ ：

$h^{(3)} (X) = u (r_{0}, r_{1}, X) \cdot t (r_{0}, r_{1}, X) = u_{1} \cdot E^{(2)} (1) \cdot t (r_{0}, r_{1}, X) \cdot X + u_{2} \cdot E^{(2)} (2) \cdot t (r_{0}, r_{1}, X) \cdot (1 - X) + u_{4} \cdot E^{(2)} (4) \cdot \tilde{t} (r_{0}, r_{1}, X) \cdot (1 - X)$

如果 $\tilde{t}$ 有内部结构，那么

$h^{(3)} (X) = u_{1} \cdot E^{(2)} (1) \cdot (m (X, j = 2, b_{2} = 1) \cdot t (r_{0}, r_{1}, b_{2} = 1) + a (X, j = 2, b_{2} = 1)) \cdot (1 - X) + u_{2} \cdot E^{(2)} (2) \cdot (m (X, j = 2, b_{2} = 0) \cdot t (r_{0}, r_{1}, b_{2} = 0) + a (X, j = 2, b_{2} = 0)) \cdot X + u_{4} \cdot E^{(2)} (4) \cdot (m (X, j = 2, b_{2} = 0) \cdot \tilde{t} (r_{0}, r_{1}, b_{2} = 0) + a (X, j = 2, b_{2} = 0)) \cdot (1 - X) = u_{1} \cdot E^{(2)} (1) \cdot (m (X, j = 2, b_{2} = 1) \cdot T^{(2)} (1) + a (X, j = 2, b_{2} = 1)) \cdot (1 - X) + u_{2} \cdot E^{(2)} (2) \cdot (m (X, j = 2, b_{2} = 0) \cdot T^{(2)} (2) + a (X, j = 2, b_{2} = 0)) \cdot X + u_{4} \cdot E^{(2)} (4) \cdot (m (X, j = 2, b_{2} = 0) \cdot T^{(2)} (4) + a (X, j = 2, b_{2} = 0)) \cdot (1 - X)$

Prover 发送 $(h^{(3)} (0)), h^{(2)} (1), h^{(3)} (2))$ 作为 $h^{(3)} (X)$ 的点值形式发送。

Verifier 发送挑战数 $r_{2}$ ，Prover 和 Verifier 检查

$h^{(2)} (r_{2}) = ? h^{(3)} (0) + h^{(3)} (1)$

Prover 和 Verifier 最后通过 PCS 来验证下面的 Evaluation 等式：

$h^{(3)} (r_{3}) = ? u (r_{0}, r_{1}, r_{2}) \cdot t (r_{0}, r_{1}, r_{2})$

Prover 更新 $E$ 到 $E^{(3)}$ ，则得到 $v_{u} = \tilde{u} (r_{0}, r_{1}, r_{2})$ ：

$E^{(3)} (1) E^{(3)} (2) E^{(3)} (4) = E^{(2)} (1) \cdot r_{2} = E^{(2)} (2) \cdot (1 - r_{2}) = E^{(2)} (4) \cdot (1 - r_{2}) = (1 - r_{0}) \cdot (1 - r_{1}) \cdot r_{2} = (1 - r_{0}) \cdot r_{1} \cdot (1 - r_{2}) = r_{0} \cdot (1 - r_{1}) \cdot (1 - r_{2})$

Prover 可以通过 $E^{(3)}$ 来计算得到 $v_{u} = \tilde{u} (r_{0}, r_{1}, r_{2})$ ，计算时间复杂度为 $O (m)$ ：

$\tilde{u} (r_{0}, r_{1}, r_{2}) = u_{1} \cdot E^{(3)} (1) + u_{2} \cdot E^{(3)} (2) + u_{4} \cdot E^{(3)} (4)$

Prover 并不需要发送 $\tilde{t} (r_{0}, r_{1}, r_{2})$ ，因为这个值可以由 Verifier 直接计算得到，计算时间复杂度为 $O (m)$ 。

综上，Prover 的计算量为 $O (m \cdot lo g N)$ 。

4. Standard Sparse-dense Sumcheck

标准的 Sparse-dense Sumcheck 可以把 $lo g N$ 轮的 Sumcheck 过程拆分成 $c = \frac{l o g N}{l o g m}$ 个分段，在每个分段中，Prover 都预计算一些辅助的向量，从而避免在接下来的 Sumcheck 分段中做一些重复的计算。这个分段加预计算的步骤被称为 Condensation。通过这种方法，Prover 的计算量可以从 $O (m \cdot lo g N)$ 降到 $O (c \cdot m)$ ，其中 $c = \frac{l o g N}{l o g m}$ ，即 $N = m^{c}$ 。

4.1 理解 Condensation

我们先描述一个 Sparse-dense Sumcheck 简单情况。假设查询表格 $t$ 中的每一个表项 $t_{i}$ 都可以用它的 index 的二进制位来计算，例如 $t_{i}$ 的值可以通过下面的方式计算：

$t (i_{0}, i_{1}, \dots, i_{s - 1}) = d_{0} i_{0} + d_{1} i_{1} + \dots + d_{s - 1} i_{s - 1}$

其中 $i = i_{0} + i_{1} \cdot 2 + \dots + i_{s - 1} \cdot 2^{s - 1}$ 为 $t_{i}$ 的表格索引。那么如果给定 $t (i_{0}, \dots, i_{k}, \dots, i_{s - 1})$ 的值，我们可以在常数时间内计算 $t (i_{0}, \dots, c, \dots, i_{s - 1})$ 的值。

$t (i_{0}, \dots, c, \dots, i_{s - 1}) = t (i_{0}, \dots, i_{k}, \dots, i_{s - 1}) + d_{k} \cdot (c - i_{k})$

上面这个等式想要表达的含义是：表格的每一项可以表达为该表项的索引（Index）的线性组合，并且是关于 Index 的二进制位的一次多项式。例如 RangeCheck 表格就满足这个特征。

回忆 Generalized Lasso 协议，其核心是证明下面的等式：

$f (X) = y \in {0, 1}^{l o g N} \sum M (X, y) \cdot \tilde{t} (y)$

通过 Verifier 提供的一个随机挑战数，上面的等式可以转化为：

$f (r) = y \in {0, 1}^{l o g N} \sum M (r, y) \cdot \tilde{t} (y)$

令 $u = \tilde{M} (r, y)$ ，那么等式转换为一个 Inner Product 的形式：

$f (r) = b \in {0, 1}^{l o g N} \sum u (b) \cdot \tilde{t} (b)$

等式右边是一个 $N$ 项的求和式，如果直接让 Prover 去计算每一项中的 $u (b)$ 和 $t (b)$ ，那么 Prover 的计算量至少为 $2 N$ 次 evaluation。但是我们可以利用 $u (b)$ 和 $t (b)$ 的内部结构来进行优化。首先 $u (b)$ 编码了一个长度为 $N$ 的向量，记为 $u$ ，它相当于也编码了矩阵 $M$ 的信息，只有 $m$ 个非零值。因此我们只需要 $O (m)$ 就可以计算出所有的 $u (X)$ 在所有 $X = b$ 处的取值。其次 $t (b)$ 编码了 $t$ ，它是一个 MLE-structured 的表格，其每一项都与 Index 的二进制位有关，因此每一个表项 $t_{i}$ 都可以在 $O (lo g N)$ 时间内计算得到。最后，考虑求和式 $\sum_{b \in {0, 1}^{l o g N}} u (b) \cdot t (b)$ 中若 $u (b) = 0$ ，那么我们就不需要再计算 $\tilde{t} (b)$ 。因此，这个求和式整体上也只需要 $O (m)$ 次 evaluation 即可。

这个 $N$ 项的求和过程如果使用 Sumcheck 协议来证明，那么需要 $lo g N$ 轮。在第 $j$ 轮中，由于我们都可以根据上一轮 $t (r_{0}, r_{1}, \dots, r_{j - 1}, b_{j}, \dots, b_{l o g N - 1})$ 来计算 $t (r_{0}, r_{1}, \dots, r_{j - 1}, r_{j}, \dots, b_{l o g N - 1})$ ，因此只需要常数时间的计算量。

我们引入两个辅助的向量 $q$ 与 $z$ ，Prover 可以在 Sumcheck 协议运行前就计算好 $q$ 与 $z$ 的值，然后 Prover 可以利用这些预计算的向量，在 Sumcheck 协议的前 $lo g m$ 轮中（记住，Sumcheck 协议总共有 $lo g N$ 轮，我们假设 $lo g N > lo g m$ ）加速计算求和式。这两个向量的每个元素 $q_{k}$ 与 $z_{k}$ ， $k \in [0, m)$ 定义如下：

$q_{k} = y \in extend (k, l o g m, l o g N) \sum u (y) \cdot t (y)$

$z_{k} = y \in extend (k, l o g m, l o g N) \sum \tilde{u} (y)$

这里我们引入了一个新的符号： $extend (k, lo g m, lo g N)$ ，它是一个二进制串的集合

$extend (k, lo g m, lo g N) = {y \in {0, 1}^{l o g N} ∣ prefix (y) = bits (k)}$

然后筛选那些二进制串的前 $lo g m$ 位与 $k$ 的二进制位相等（我们采用 Big-endian 的表示方式，前面的位为高位），而后面的 $lo g N - lo g m$ 位可以任意值。例如， $extend (1 0_{(2)}, 2, 4) = {\underline{10} 0 0_{(2)}, \underline{10} 0 1_{(2)}, \underline{10} 1 0_{(2)}, \underline{10} 1 1_{(2)}}$ 。这个集合中每一个二进制串都是以 $10$ 打头。

那么 $q$ 向量的每一个元素 $q_{i}$ ，是筛选出那些高位等于 $bits (i)$ 的二进制串（长度为 $lo g N$ ） $y$ ，然后通过 $y$ 为索引，计算 $u (y) \cdot t (y)$ 的求和。换句话说，我们通过 $q$ 把前面 $N$ 项求和式 $\sum_{b \in {0, 1}^{l o g N}} u (b) \cdot t (b)$ 划分为了 $lo g m$ 个子集，然后分别对其进行求和。由于 $\tilde{u}$ 的 $O (m)$ 稀疏性， $q$ 的计算量也是 $O (m)$ 。

再换一个思路去理解，如果我们把 $N$ 项求和式的计算过程描述成一棵深度为 $lo g N$ 的二叉树，其中树根（第 0 层）为最后的和。而其中每个叶子节点都是 $u (b) \cdot t (b)$ ，这里 $b \in {0, 1}^{l o g N}$ ，因此总共有 $N$ 个叶子。那么向量 $q$ 就是这颗二叉树中第 $lo g m - 1$ 层的所有节点。

同样， $k$ 是叶子结点为 $\tilde{u} (b)$ 的求和二叉树中的第 $lo g m - 1$ 层。接下来，我们看看 Prover 在 Sumcheck 协议中前 $lo g m$ 轮的计算过程（总共有 $lo g N$ 轮），并且看下这两个辅助向量的作用。

在第一轮中，Prover 要构造一个一元多项式 $h^{(1)} (X)$

$h^{(1)} (X) = (b_{1}, b_{2}, \dots, b_{l o g N - 1}) \in {0, 1}^{l o g N - 1} \sum u (X, b_{1}, b_{2}, \dots, b_{l o g N - 1}) \cdot t (X, b_{1}, b_{2}, \dots, b_{l o g N - 1})$

我们把 $\tilde{u} (X, b_{1}, b_{2}, \dots, b_{l o g N - 1})$ 按照定义展开，可以得到：

$h^{(1)} (X) = (b_{1}, b_{2}, \dots, b_{l o g N - 1}) \in {0, 1}^{l o g N - 1} \sum (i \in S_{u} \sum u_{i} \cdot e q_{i} (X, b_{1}, b_{2}, \dots, b_{l o g N - 1})) \cdot t (X, b_{1}, b_{2}, \dots, b_{l o g N - 1})$

这里的 $S_{u}$ 表示 $u$ 中非零元素的索引（的二进制表示）的集合。然后把所有的求和号都展开，我们发现当 $bits (i) = (i_{0}, i_{1}, \dots, i_{l o g N - 1}) \neq \in S_{u}$ 时， $u_{i} = 0$ ，因此，我们只要关注上面求和式中 $b = bits (i)$ 对应的那些非零项（这时候 $u_{i} \neq = 0$ ）：

$h^{(1)} (X) = i \in S_{u} \sum u_{i} \cdot e q_{i} (X, i_{1}, i_{2}, \dots, i_{l o g N - 1}) \cdot t (X, i_{1}, i_{2}, \dots, i_{l o g N - 1})$

上面的等式已经变成了一个 $m$ 项的求和式。接下来我们根据 $t$ 的结构性，展开 $t (X, i_{1}, i_{2}, \dots, i_{l o g N - 1})$ ，并且根据 $e q_{i} (X, i_{1}, i_{2}, \dots, i_{l o g N - 1})$ 的 Tensor 结构，即 $e q_{i} (X, i_{1}, i_{2}, \dots, i_{l o g N - 1}) = e q_{i_{0}} (X) \cdot e q_{i} (i_{1}, \dots, i_{l o g N - 1}) = e q_{i_{0}} (X)$ ，我们可以得到：

$h^{(1)} (X) = i \in S_{u} \sum u_{i} \cdot e q_{i_{0}} (X) \cdot (t (i_{0}, i_{1}, i_{2}, \dots, i_{l o g N - 1}) + (X - i_{0}) \cdot d_{0})$

我们再展开 $\tilde{e q}_{i_{0}} (X) = (1 - X) \cdot (1 - i_{0}) + X \cdot i_{0}$ ，可得：

$h^{(1)} (X) = i \in S_{u} \sum u_{i} \cdot ((1 - X) \cdot (1 - i_{0}) + X \cdot i_{0}) \cdot (t (i_{0}, i_{1}, i_{2}, \dots, i_{l o g N - 1}) + (X - i_{0}) \cdot d_{0}) = i = (i_{0} = 0, i_{2}, \dots, i_{l o g N - 1}) \in S_{u} \sum (1 - X) \cdot u_{i} \cdot t (i_{0}, i_{1}, i_{2}, \dots, i_{l o g N - 1}) + (1 - X) \cdot X \cdot d_{0} \cdot u_{i} + i = (i_{0} = 1, i_{2}, \dots, i_{l o g N - 1}) \in S_{u} \sum X \cdot u_{i} \cdot \tilde{t} (i_{0}, i_{1}, i_{2}, \dots, i_{l o g N - 1}) + X \cdot (X - 1) \cdot d_{0} \cdot u_{i}$

这时候，我们可以代入之前计算的辅助向量 $q$ 与 $z$ ，其中第 $k$ 项为 $q_{k} z_{k} = q_{(k_{0}, k_{1}, \dots, k_{l o g m - 1})} = (j_{0}, j_{1}, \dots, j_{l o g N - l o g m - 1}) \in {0, 1}^{l o g N - l o g m} \sum u (k_{0}, k_{1}, \dots, k_{l o g m - 1}, j_{0}, j_{1}, \dots, j_{l o g N - l o g m - 1}) \cdot t (k_{0}, k_{1}, \dots, k_{l o g m - 1}, j_{0}, j_{1}, \dots, j_{l o g N - l o g m - 1}) = z_{(k_{0}, k_{1}, \dots, k_{l o g m - 1})} = (j_{0}, j_{1}, \dots, j_{l o g N - l o g m - 1}) \in {0, 1}^{l o g N - l o g m} \sum \tilde{u} (k_{0}, k_{1}, \dots, k_{l o g m - 1}, j_{0}, j_{1}, \dots, j_{l o g N - l o g m - 1})$

注意到， $q_{k}$ 与 $z_{k}$ 是按照前 $lo g m$ 位进行划分后的第 $k$ 个子集的求和。我们可以把 $h^{(1)} (X)$ 重新写成两个 $lo g m$ 项的求和式：

$h^{(1)} (X) = (0, k_{1}, k_{2}, \dots, k_{l o g m - 1}) \in {0, 1}^{l o g m} \sum (1 - X) \cdot q_{k} + d_{0} \cdot (1 - X) X \cdot z_{k} + (1, k_{1}, k_{2}, \dots, k_{l o g m - 1}) \in {0, 1}^{l o g m} \sum X \cdot q_{k} + d_{0} \cdot (1 - X) X \cdot z_{k}$

这样 Prover 只需要 $O (m)$ 的计算量就可以完成第一轮的计算，这个计算包括计算 $h^{(1)} (X)$ 在 $X = 0, 1, 2$ 处的求值运算。

那么第二轮开始到第 $lo g m$ 轮，每一轮 Prover 都只需要 $O (m)$ 的计算量就可以完成计算 $h^{(j)} (X)$ 在 $X = 0, 1, 2$ 处的求值。

但是到了第 $lo g m + 1$ 轮，情况会发生变化，因为这时候 Prover 要计算 $N - m$ 个项的求和，并且 $q$ 和 $z$ 两个辅助向量已经失效。因此，对于下面新的 $lo g m$ 个轮次，Prover 需要重新计算 $q$ 与 $z$ ，然后按照上面的方案继续。这样相当于把 $lo g N$ 轮的 Sumcheck 按照 $lo g m$ 的数量进行划分，每一个 $lo g m$ 轮次，Prover 都需要重新计算 $q$ 与 $z$ ，然后保证 $h^{(j)} (X)$ 的计算始终是 $2 m$ 个项的求和式。每次重新计算 $q$ 与 $z$ 的操作被称为 Condensation。

3.2 一般性 $t$ 结构

上一小节的讨论基于一个比较强的表格结构：

$t (i_{0}, i_{1}, \dots, i_{s - 1}) = d_{0} i_{0} + d_{1} i_{1} + \dots + d_{s - 1} i_{s - 1}$

对于 AND 表格与 SLT 表格等不满足上面结构要求的表格，我们需要放松表格的结构条件。首先， $t$ 可以是多个多项式之和，并且每一个多项式 $t_{l}$ 的计算过程基于 index 的二进制表示，当 index 发生变化时， $\tilde{t}$ 的值的变化只需要常数个加法和乘法操作：

$t = l = 0 \sum η - 1 t_{l}$

$t_{l} (r_{0}, \dots, r_{j - 1}, X, b_{j + 1}, \dots, b_{l o g N - 1}) = m_{l} (X, j, b_{j}) \cdot t_{l} (r_{0}, \dots, r_{j - 1}, b_{j}, b_{j + 1}, \dots, b_{l o g N - 1}) + d_{l} \cdot (X - r_{j}) + a_{l} (X, j, b_{j})$

第一周 (10.15~10.21):

课程学习资料:
课程学习目标: Understanding and building user-facing applications with Halo2 and PLONKish proving systems

第二周 (10.22~10.28):

课程学习资料:
- 2-simple circuit
- 3-custom gate
- 4-fibonacci
- 0xPARC halo2 Lecture:
  - Halo2 API & Building a Basic Fibonacci Circuit (Part 1)
  - Halo2 API & Building a Basic Fibonacci Circuit (Part 2)
课程学习目标:
- 理解 halo2 中 Circuit、region、Layouter、custom gate、constraints 等概念及其 API 代码 represent.
- 能够理解 Fibonacci 示例和 isZero 示例的电路构建流程

第三周 (10.29~11.04)

课程学习资料:
- lookup table
课程学习目标:
- 掌握 halo2 中 lookup / lookup_any API 的使用，及其常见应用场景（如 Range-check）

第四周 (11.06~11.12)

课程学习资料:
- 0xPARC decompose
- 代码 repo: https://github.com/zkp-co-learning/halo2-step-by-step
- 推荐参考笔记： https://learn.z2o-k7e.world/halo2/tmp/9-decomposed.html
课程学习目标:
- decompose 是一个综合性的代码实践，要求我们在阅读源码的同时掌握 halo2 的核心 API。

第五周 (11.13~11.19)

① zkEmail

本周以 zkEmail 为例的 zk 应用实例的 halo2 真实应用场景代码实践。

zkEmail 学习方法论：

首先要明确学习目标，学习 zkEmail 能学到什么？我觉得有以下几点：

zk email 是一个解决“实际业务”的中型电路系统；
zk email 是强烈依赖 halo2-base 的，而 halo2-base 对 halo2 电路有着一定的优化，主要体现在接口优化和灵活的行列设计；
zk email 中会涉及到 RSA，biguint，sha256，regex，base64 等电路；代码模块比较清晰，每个模块也有例子，一周时间学习全部的内容有点多，大家可以根据需求学习；

如果有对以上有兴趣的同学可以学习 zk email 的学习路线建议：

我觉得可以先从 halo2-base 入手，学习 axiom 对 halo2 做的优化；
选择一个感兴趣的模块分析代码切入，逐步深入，比如从 biguint 计算 => RSA , 逐步把 RSA，Regex，Sha256 这几个电路理解，再理解 zk email 是如何像堆积木一样把整个大电路堆积起来的；

halo2-zk-email 中可以学习到的更多是在电路前端设计上，规模属于中型应用，可能还是花费一些时间的。

由 @DK(零与一)@secbit 帮助整理 ~

top-down 的 approach:

直接打开 https://emailwallet.org/ 去玩他们最新的出来的 emailwallet
看 slides: https://docs.google.com/presentation/d/1nHW57t8SQ-NCqK366_xpkB7WuC3lFX-9/
docs: https://docs.sendeth.org/
再打开 github: https://github.com/zkemail，就接起来了。

由 @Kurt Pan 帮助整理 ~

② zkEVM

zkEVM Word encoding

下次 oh 会介绍一下 zkevm。以 PSE/Scroll zkevm-circuit 代码为例子。

可以先通过 https://www.evm.codes 了解一下 EVM 指令集，在 playground 玩一下感兴趣的指令。

然后，通过下面的资料了解下 evm bytecode 的组成格式，执行过程。

最后，推荐 PSE 的 zkevm-specs，文档中详细定义了 zkevm 电路的约束，并且提供了对应的 python 代码。

https://github.com/privacy-scaling-explorations/zkevm-specs

由 @Yang Zhou 帮助整理 ~

**前置学习 (PLONK & Rust)：**

必备学习材料：

0xPARC Halo2 是主要参考的视频课程
参考代码是对课程 Reference 代码必要的优化和版本升级
参考文档: z2o-k7e-Halo2 是部分电路图解 & 对代码更细致的阐释(仍更新中…) ¹
其他必读参考：
1. zcash halo2 book / github 理论内容偏多，可以当做字典反复查看
2. zcash halo2 book 中文翻译 / github

其他参考资源:

for 纯新手:

新手学习 ZKP 可以参考新手村入门攻略 https://learn.z2o-k7e.world/zk-everything/zk-roadmap.html (must)
学习 PLONK 郭老师的系列没跟上非常正常，一般正常人都大概需要反复读 5 遍，各种概念不断交叉记忆，相互关联，然后才能建立一些直观的印象
有了一定的印象后，可以参考 @Harry L 为文档写的 python 代码，手敲印证，加深印象 (optional)
学习 Rust 编程 (must)
halo2 学习方法论： https://learn.z2o-k7e.world/halo2/halo2.html (must)

!有任何看不懂的 Part 都可以提 issue 或者 Q&A ~

备注：因为现在还没有关于 halo2 特别好的一站式课程，所以很多参考资源需要反复研究 & 交叉印证

目前我们正在对部分教程内容进行重新的整理&修改，会随着课程逐步更新和优化，欢迎 👏🏻 PR 和 issue ！

作者: @Po@Ethstorage.io / @Demian / @Keep

时间: 2023-10-18

校对: @Po@Ethstorage.io / @Demian

Halo2核心概念
- Halo2 电路结构
  - Columns
  - Rows
  - Gate
  - Copy constraint
  - Region
  - Layouter
    - SimpleFloorPlanner
  - Diagrams
- Halo2 编程模型

Halo2核心概念

在前面的 prerequisite 课程中，我们学习了 PLONK 协议及其 lookup table 优化，在本节我们将会以 halo2 这个 Rust library 为基础，详细讲解 Halo2 的相关基本概念。

Halo2 电路结构

我们知道，在 Vanilla PLONK 协议中，门约束系统相对固定和局限，表现力并不强：

$f (x) = Q_{L} (x) \cdot a (x) + Q_{R} (x) \cdot b (x) + Q_{O} (x) \cdot c (x) + Q_{M} (x) \cdot a (x) b (x) + Q_{C} (x)$

为了支持更复杂和更高阶的运算，halo2 中引入了 custom gate 和 lookup table，这使得约束系统中的约束并不限定在某一行上的变量，custom gate 可以任意指定约束需要的计算。 ¹

如下图，可以清晰地看到 PLONK 每个版本的演进，从而让 halo 2 能对 custom constraints 和 lookup table 进行支持：

在一般的电路代码结构中，都会有输入、输出、约束等必要构件，在 halo2 中也不例外。只不过，不像 R1CS 那般每个约束都严丝合缝地写成 $c === a * b$ 的格式，halo2 中，电路的 arithmetization（电路中的 expression）可以形象地看作是成一张矩形表 (table)，所有的约束则可以通过在这张表中规划区域(region)，放置单元格(cells) 来构造。

The halo2 Book: The language that we use to express circuits for a particular proof system is called an arithmetization. Usually, an arithmetization will define circuits in terms of polynomial constraints on variables over a field. ²

如下图可以看到：

电路表整体由单元（cell）、列（Column）和行（Row）组成，
相邻的cell、row 和 colum 的任意组合可以构成 region
列又可以分为三种类型：advice，instance 和 selector，
- 其中 advice/instance columns 在同一个电路中填入的值可以不一样
- fixed 和 selector columns 在电路 preprocessed 阶段生成，同一个电路填入的值是一样的，可以视为是电路结构固定的一部分

下面，我们会分别详细讲解各部分组件的用途及使用方法 ³

Columns

我们可以将电路的输入和输出概念化为给定有限域 $F$ 上 $m$ 列 $n$ 行的矩阵

下面我们来详细讲解各个 columns 的含义和用途：

instance columns ：包含了 Prover/Verifier 之间共享的输入，通常用于公共输入 (public inputs)

例如 SHA256 的结果
Merkle Tree 的根

advice columns：包含了 private input & 电路运行中所需的中间变量，即witness,这部分只有 $P ro v er$ 知道

fixed columns ：包含在 key generation 阶段设置的 preprocessed values，可以视为是电路结构固定的一部分，也是可以被 pre-compute 的

如电路中 hardcoded constant
查找表 Lookup table column

selector columns ：即选择器，同样是在 key generation 阶段设置的 preprocessed values

有些教程中也会直接将 selector columns 放入 fixed columns 中，这完全正确！因为 Selector 就是特殊的 fixed columns

Tips: 同一行可以支持若干种不同的约束, 比如三元三次, 或者三元二次, 可以通过 selector 来选择具体需要满足哪个约束。比如有 3 个 custom gate, 可以只满足其中一个就 OK , 或者满足其中的 2 个，非常灵活

Rows

矩阵中的行数通常是 2 的幂，受有限域 F 的大小限制；行数对应于 Plonkish 算术化(arithmetization) 中的 n-th 单位根(nth root of unity)。约束适用于所有行(apply to all the rows)，但可以通过选择器列中定义的 Selector 启用/禁用。 ⁴

Gate

门(Gate) 通常是由一组约束构成，这组约束通常受 selector 控制。 Halo2 提供两种类型的门：

标准门(Standard gate)：标准门支持通用算术，例如域乘法和除法
自定义门(Custom gate)：自定义门更具表现力，能够支持电路中的专门操作；下面的斐波那契电路显示了自定义门的示例（请注意，启用选择器时，门将应用于每一行）

Copy constraint

Permutation Argument 提供了一种 cheap 的方式来证明集合中部分值的相等性。

如下图，在 Fibonacci 示例中，我们会通过 copy_advice API 强制约束红色框、蓝色框的 2 对值分别相等

Region

如果是第一次看视频或者读相关文档，你可能会发现 Region 是一个略显抽象的概念，不过没关系，向下读！

在 halo2 中我们不会直接约束一整个电路的行和列，而是将整个电路划分为由相邻的行和列组成的 region，在 region 中可以采用相对偏移(relative offsets)的方式访问 Cell。在一个 region 中，我们只关心 cells 之间的相对关系

如果两个约束没有关系，或者您也不关心两个 “cell” 之间如何相互作用的话，那么就应该将它们分别定义在 2 个不同的 regions 中，如此就可以将控制权交给halo2默认的layouter，让 layouter 去优化整体电路 region 分布，比如合并不同的region到一行来减小电路的规模（layouter 后面会讲解）。

因此，并不推荐将整个电路的逻辑都塞进同一个庞大的 region，您应该尝试将其尽可能分解为逻辑清晰、结构简单的 regions。 ⁵

Layouter

看完了 region 的定义和讲解后，是不是还是有点不得要领？下面我们会介绍如何使用 Layouter 去布局 region，看完后也许你会对 region 有更进一步的认识。

layouter 作用在 assignment （电路赋值）期间，即当你用 Witness 去填充整个 Circuit table 时使用。实际中，layouter一般不会一下子填满整个 table，而是每次都会创建一个 region，并在其包含的单元格中填入相应的witness值。

为了保证每个 gate 能当访问到其所需的所有单元格，一般而言对 gate 所在的 region 进行电路布局时，region 需遵循如下规则： region 不需要与 custom gate 具有相同的形状，但 region 必须覆盖所有相关的 custom gate

比如上面的例子，在最上方的电路包含两个 custom gate (红色边框标识)，可以创建如下两种region:

左边的浅绿色矩形 Region 是 Valid Region ✅ :
- 在 Region 中做的赋值 assignments 已经完全覆盖了左边的 Custom Gate 所需要的
- 假设在 selector col 中，上面的 $S_{0} = 1$ , 下面的 $S_{0} = 0$ ，则说明用到了左边的 3 个 Cell
而右边的浅绿色矩形 Region 是 invalid Region ❌:
- 它没有覆盖与 Custom Gate 相关的所有单元格。并且它并没有 assign Custom Gate 所需的所有单元格
- 如果您打开了 selector，Region 应该覆盖由 Custom Gate 控制的所有单元格。

目前在 halo2 中有 2 种 Layouter 可供选择：

SimpleFloorPlanner (重点关注，也是最常用的)
TwopassPlanner ? V1/V1Plan ？

SimpleFloorPlanner

这是一个单通道布局器 (single-pass layouter)
它为该区域中使用的每一列找到第一个空行并获取其所需的最多的单元格。
它尝试尽可能多地合并相关的 regions 以使用更少的行。

Region 的布局根据电路可以有各种形状，如:

Region 1 : use one cell for 3 advice column
Region 2 : “L shape”
Region 3 : “L shape”

以下几个 Q&A 可以帮你进一步理解 region：

Q：region 1 为什么不需要选择器？
- A：你可以认为 region 1 是你想要初始化的一些 private input，它不涉及任何 selector，即这一行的门约束必须成立
Q：如下图，为什么 region 4 不向上填充到红色区域？
- A：对于 Region 4 , 它本可以填到红色区域里面, 但是这不是咱们 SimpleFloorPlanner 能做的事 ~ （@Dr. Shen haicheng）

Diagrams

在 Halo2 中可以通过输出 diagrams 上述电路布局图，以非常直观地看到电路中所有 columns 的状态和电路整体布局，可以帮我们优化电路、查找 bug 等。

halo2 一般可以通过调用如下 API 来生成电路布局图：

#![allow(unused)]
fn main() {
#[cfg(test)]
mod tests {
  use halo2_proofs::{dev::MockProver, pasta::Fp};
  use super::*;

  // ...
  #[cfg(feature = "dev-graph")]
  #[test]
  fn plot_chap_1_circuit(){
      // Instantiate the circuit with the private inputs.
      let circuit = MyCircuit::<Fp>::default();
      // Create the area you want to draw on.
      // Use SVGBackend if you want to render to .svg instead.
      use plotters::prelude::*;
      let root = BitMapBackend::new("./images/chap_1_simple.png", (1024, 768)).into_drawing_area();
      root.fill(&WHITE).unwrap();
      let root = root
          .titled("Simple Circuit without chip", ("sans-serif", 60))
          .unwrap();
      halo2_proofs::dev::CircuitLayout::default()
          // You can optionally render only a section of the circuit.
          // .view_width(0..2)
          // .view_height(0..16)
          // You can hide labels, which can be useful with smaller areas.
          .show_labels(true)
          // Render the circuit onto your area!
          // The first argument is the size parameter for the circuit.
          .render(5, &circuit, &root)
          .unwrap();
  }
}
}

所需的 Cargo.toml 配置

[features]
dev-graph = ["halo2_proofs/dev-graph", "plotters", "plotters/bitmap_backend","plotters/bitmap_encoder"]

plotters = { version = "0.3.0", default-features = true, optional = true }

需要开启dev-graph才能调用上述命令：

cargo test --dev-graph -- --nocapture chap_1::exercise_1::tests::plot_chap_1_circuit

如上图，在一个电路布局图里：

advice columns(witness) 是 $p ink$ (粉色的)
the $l i g h t g ree n$ cells 说明在电路定义时用到了，是 Region 的一部分
the $d r ak g ree n$ cells 说明被赋值了
the $p u r pl e$ regions 是 fixed columns (preprocessed value)
- $l i g h t p u r pl e$ : selector.
- $d a r k p u r pl e$ : constant values，比如 5

对比上图的单通道布局 vs 双通道布局，我们可以观察到一些有意思的结论:

双通道布局器做了更多 region 布局方面的优化，将电路行数由 $2^{12}$ 优化到了 $2^{11}$ ，不过列数也有所增加
一般而言，我们需要在电路布局做如下权衡：
- 减少电路使用的空间 (space) ，因为行数越多，fft 操作越多，Prove 过程就越慢
- 增加电路的列数， $P ro v er$ 需要 commit 每个列，更多的列数，意味着更多的 commitments，也就意味着更大的 proof size

为什么需要 commit column? 电路结构在 preprocess 阶段已经确定，Prover 分别针对每列进行 commitment，可以有效防止 Prover 作弊，并将后续 commitment batch 起来

为什么 rows 需要 fft ? 在 PLONK 中使用了多项式承诺，可以将证明生成中涉及到大量的多项式求值、以及计算商多项式等，这些都需要使用 fft 来加速运算 (FFT提供了一个高效的方法来转换多项式系数形式和它们的点值表示)。从而验证该行的多项式约束（custom gate）是否得到满足

Halo2 编程模型

Halo2 的编程模式采用 “ 配置-> (计算+存储 +生成证明) -> 验证 ”三个阶段。

配置(configure) 阶段定义约束关系。具体而言就是在 meta.create_gate 中从 table 中 query cell，并将 query 的结果 (即 expression，可以简单的理解为从某个 cell 中获取值的方式，在 configure 阶段并不知道具体的值，在第二阶段阶段才会被赋值) 形成约束。

为了便于理解，不妨把 query 过程理解为 PCB 电路板上的探针，在 PCB 电路上探针取到的值输入到示波器或者逻辑分析仪，而 halo2 电路中的值会被用于生成证明和验证约束。需要指出，在 configure 阶段，电路并没有通电，也就是说，虽然电路板的逻辑约束已经形成，但是具体的值(信号、电流) 尚未被加载到电路中。

计算+存储（synthesize）

在电路的 synthesize 函数中，按照操作指令计算，并将计算结果填入适当的 Cell，相当于在 table上留下计算的 trace

证明生成 ：

在 Prove 阶段，所有用到的 cell 被赋值且形成计算 trace 后，halo2 会具体计算每一列的多项式承诺。

验证：在 Verify 阶段，检查所有的约束是否满足。

以上就是 Halo2 的一些关键概念，在下面一章中，我们将会以一个最简的例子尝试使用 Halo2 library 提供的 API 编写电路！

borrowed from Star.Li https://mp.weixin.qq.com/s/VerLN8-tqetKs1Hv6m4KLg

lots of images borrowed from great 0xPARC halo2 lectures

⁶

https://www.youtube.com/watch?v=W_zlH2mmtZA 0:41:20 - 0xPARC - # Intro

⁵

https://www.youtube.com/watch?v=vGQAMQRlN3E 0:30:49 - 0xPARC - L2

⁷

https://www.youtube.com/watch?v=W_zlH2mmtZA 0:44:41 - Intro

⁸

https://www.youtube.com/watch?v=vGQAMQRlN3E 0:17:42 - 0xPARC - L2

⁹

https://mp.weixin.qq.com/s/VerLN8-tqetKs1Hv6m4KLg

⁴

https://consensys.io/diligence/blog/2023/07/endeavors-into-the-zero-knowledge-halo2-proving-system/

https://zcash.github.io/halo2/concepts/proofs.html

作者: @Po@Ethstorage.io / @Demian

时间: 2023-10-18

校对: @Po@Ethstorage.io / @Demian

Halo2 API 简介

Halo2 API 简介

Overview

上节我们介绍了Halo2的核心概念，本节则以 $a^{2} * b^{2} * c = o u t$ 这个电路为例，来说明如何使用 Halo2 API来写电路。该电路的各个参数说明如下：

private inputs:  a, b, c
public inputs :  out
constraints   :  a^2 * b^2 * c = out

我们的目的是写一个电路，让Prover证明对于公共输入out,他知道三个秘密输入a, b, c满足 $a^{2} * b^{2} * c = o u t$ 这个约束。从电路的角度，只使用 乘法门 和 乘法选择器，上述约束可以算数化为:

instance	advice_0	advice_1	selector_mul
out	a
	b
	c
	a	b	1
	ab		0
	ab	ab	1
	absq		0
	absq	c	1
	out		0

看到这里可能会产生疑问，这个 table 是如何填写出来的呢？其实，这个填写规则是与门约束一一对应的，而门约束可以很随意设计，所以关键是得确定

有几种门约束

每种门约束涉及哪几个单元格及多项式约束公式 absq 即 ab 的平方。

我们的目的则是：

利用 Halo2 定义好上述约束 (gates 和 equality constrains)，
并使用其 private value 填好上述表格 (即 assign witness)。

使用 Halo2 编写电路，需要为 struct MyCircuit 实现 halo2_proofs::plonk::Circuit trait, 其中包括以下 3 个关联方法: ¹

without_witnesses: 创建默认无需 witness 的 Circuit 实例
configure: 需要自定义:
1. 电路配置:
  1. advice cols (即 witness，包含 private inputs 和 trace),
  2. instance cols (Public Inputs)
  3. selector (电路选择器)
2. custom gate 约束
synthesize: 需要根据上述表格实现填充 witness 的逻辑，即按照验证程序的逻辑正确写入将数据写入表格的每个 Cell:
1. 填充以 Region 为基本单位(多行+多列构成的矩形)，可以在 region 中以相对引用的方式引用其他Row
2. 有两种填充方式: copy_advice (还会产生 equality 约束) + assign_advice(不会产生 equality 约束)

一旦定义好上述 3 个关联方法，Halo2 便可以在电路实例化后调用相关 API 自动运行(不需要手动触发上述函数)上述逻辑来填充 witness 和生成 proof。

创建电路和 Config

根据电路构建所需模块，首先需要确定电路配置，上述电路一共需要四列: ²

2 列 witness(advice) 用来填充上述表格的a0和a1列，
- 其中 3 个 Private inputs: a, b 和 c 填入 a0 列的前三行。
1 列 instance (填入公共输出 out),
1 列乘法门选择器(s_mul);

#![allow(unused)]
fn main() {
#[derive(Debug, Clone)]
struct CircuitConfig {
    advice: [Column<Advice>;2],
    instance: Column<Instance>,
    s_mul: Selector,
}

#[derive(Default)]
struct MyCircuit<F:Field> {
    c: F,
    a: Value<F>,
    b: Value<F>
}
}

实现 Circuit trait 的前两个关联方法

根据电路配置以及我们只需要乘法门，来实现configure 方法：

#![allow(unused)]
fn main() {
impl <F:Field> Circuit<F> for MyCircuit<F> {
  fn without_witnesses(&self) -> Self {
        Self::default()
    }

    fn configure(meta: &mut ConstraintSystem<F>) -> Self::Config {
        let advice = [meta.advice_column(),meta.advice_column()];
        let instance = meta.instance_column();

        meta.enable_equality(instance);
        for c in &advice {
            meta.enable_equality(*c);
        }
        let s_mul = meta.selector();
        /* Gate design:
            | a0 | a1 | s_mul|
            |----|----|------|
            |lhs |rhs |s_mul |
            |out |    |      |  
        */
        meta.create_gate("mul_gate", |meta| {
            let lhs = meta.query_advice(advice[0], Rotation::cur());
            let rhs = meta.query_advice(advice[1], Rotation::cur());
            let out = meta.query_advice(advice[0], Rotation::next());
            let s_mul = meta.query_selector(s_mul);
            vec![s_mul * (lhs*rhs - out)]
        });

        CircuitConfig {
            advice,
            instance,
            s_mul
        }
    }
}
}

需要注意的是 Halo2 中为了优化需要通过 enable_equality 明确指定哪些列设置 equality 约束。同时由于要保证 gate 对每一行的 witness 都满足约束，所以只能通过 query_advice 来获取每个门虚拟的输入和输出(实际的值在 synthesize 时填入)以生成多项式约束，即保证 gate 返回的 vec 为 0。

实现 witness 填充

按照表格,一步步填充 witness：

load private inputs a, b 和 c
分别计算三个乘法的输入输出值 (ab, absq, out)，并通过 assign_advice 和 copy_advice 这两个 API 填充 Cell
通过 constrain_instance API, 约束 out 所在的 Cell 和 instance 列的第一个 cell 相等

#![allow(unused)]
fn main() {
fn load_private<F:Field>( 
    config: &CircuitConfig,
    mut layouter: impl Layouter<F>,
    value: Value<F>) -> Result<Number<F>, Error> {
    layouter.assign_region(
        || "load private", 
        |mut region| {
            region.assign_advice(
                || "private input", 
                config.advice[0], 
                0, 
                || value
            ).map(Number)
    })
}

fn load_constant<F:Field>( 
    config: &CircuitConfig,
    mut layouter: impl Layouter<F>,
    c: F
) -> Result<Number<F>, Error> {
    layouter.assign_region(
        || "load private", 
    |mut region| {
        region.assign_advice_from_constant(
            || "private input", 
            config.advice[0], 
            0, 
            c
        ).map(Number)
    })
}

fn mul<F:Field>(
    config: &CircuitConfig,
    mut layouter: impl Layouter<F>,
    a: Number<F>,
    b: Number<F>,
) -> Result<Number<F>, Error> {
    layouter.assign_region(
        || "mul", 
    |mut region| {
        config.s_mul.enable(&mut region, 0)?;
        a.0.copy_advice(|| "lhs", &mut region, config.advice[0], 0)?;
        b.0.copy_advice(|| "rhs", &mut region, config.advice[1], 0)?;

        let value = a.0.value().copied() * b.0.value().copied();
        region.assign_advice(|| "out=lhs*rhs", config.advice[0], 1, || value)
        .map(Number)
    })
}

impl <F:Field> Circuit<F> for MyCircuit<F> {
    //...
    fn synthesize(&self, config: Self::Config, mut layouter: impl Layouter<F>) -> Result<(), Error> {
        let a = load_private(&config,layouter.namespace(|| "load a"), self.a)?;
        let b = load_private(&config,layouter.namespace(|| "load b"), self.b)?;
        let c = load_constant(&config,layouter.namespace(|| "load c"), self.c)?;


        let ab = mul(&config,layouter.namespace(|| "a*b"), a, b)?;
        let absq = mul(&config,layouter.namespace(|| "ab*ab"), ab.clone(), ab)?;
        let out = mul(&config, layouter.namespace(|| "absq*c"), absq, c)?;

        //expose public
        layouter.namespace(|| "expose out").constrain_instance(out.0.cell(), config.instance, 0)
    }
}
}

Mock prove

最后实例化电路，并调用相应的Mock Prover来验证:

#![allow(unused)]
fn main() {
#[cfg(test)]
mod tests {
    use halo2_proofs::{dev::MockProver, pasta::Fp};
    use super::*;
    #[test]
    fn test_simple() {
        // ANCHOR: test-circuit
        // The number of rows in our circuit cannot exceed 2^k. Since our example
        // circuit is very small, we can pick a very small value here.
        let k = 5;
    
        // Prepare the private and public inputs to the circuit!
        let c = Fp::from(2);
        let a = Fp::from(2);
        let b = Fp::from(3);
        let out = c * a.square() * b.square();
        println!("out=:{:?}",out);
    
        // Instantiate the circuit with the private inputs.
        let circuit = MyCircuit {
            c,
            a: Value::known(a),
            b: Value::known(b),
        };
    
        // Arrange the public input. We expose the multiplication result in row 0
        // of the instance column, so we position it there in our public inputs.
        let mut public_inputs = vec![out];
    
        // Given the correct public input, our circuit will verify.
        let prover = MockProver::run(k, &circuit, vec![public_inputs.clone()]).unwrap();
        assert_eq!(prover.verify(), Ok(()));
    
        // If we try some other public input, the proof will fail!
        public_inputs[0] += Fp::one();
        let prover = MockProver::run(k, &circuit, vec![public_inputs]).unwrap();
        assert!(prover.verify().is_err());
        println!("simple success!")
        // ANCHOR_END: test-circuit
    }
}
}

其中:MockerProver.run会分别调用实例化电路的 configure 和 synthesis 函数以生成电路约束和填充 witness 列(详见 Prover 的assign_advice函数)。 prover.verify() 则会检查所有的门、lookup、permuation等生成的约束是否满足。

运行cargo run test_chap_1_simple, 测试成功。

检查 Circuit 布局

同时，还可以利用上节提到的 Halo2 的 tool 输出电路的整个布局图，advice 列均为红色，instance 列为浅蓝色，selector 列为深蓝色；不同的 region 之间由黑色线分隔，填充过值的 advice 和 instance 列的单元格由绿色和浅绿色组成，填充过值的instance单元格则为深蓝色。可根据此图检查电路是否欠约束(under constraint)，如果欠约束会明显发现对应的单元格不是绿色。

#![allow(unused)]

fn main() {
    #[cfg(feature = "dev-graph")]
    #[test]
    fn plot_circuit(){
        // Instantiate the circuit with the private inputs.
        let circuit = MyCircuit::<Fp>::default();
        // Create the area you want to draw on.
        // Use SVGBackend if you want to render to .svg instead.
        use plotters::prelude::*;
        let root = BitMapBackend::new("layout.png", (1024, 768)).into_drawing_area();
        root.fill(&WHITE).unwrap();
        let root = root
            .titled("Simple Circuit without chip", ("sans-serif", 60))
            .unwrap();

        halo2_proofs::dev::CircuitLayout::default()
            // You can optionally render only a section of the circuit.
            // .view_width(0..2)
            // .view_height(0..16)
            // You can hide labels, which can be useful with smaller areas.
            .show_labels(true)
            // Render the circuit onto your area!
            // The first argument is the size parameter for the circuit.
            .render(5, &circuit, &root)
            .unwrap();
    }
}

运行cargo test plot_chap_1_circuit --features dev-graph，可以输出电路结构图。

从下图可以看出，整个电路一共9行4列，与表格设计一致。

总结

我们实现电路时一般可遵循三步法:

确定电路配置：需要几列
确定好电路需要怎样的门:乘法门，还是自定义门，还是需要加 lookup。这样就可以实现 Circuit 的 configure 关联方法
根据电路所需的输入输出，填充好 witness。这样就可以实现 Circuit 的 synthesize 关联方法

./halo2_proofs::plonk::Circuit

完整代码在 halo2-tutorials: chap-1

作者: @Po@Ethstorage.io

时间: 2023-10-20

校对: @Demian

Custom gates and Chip
- Custom gates
- Chip
  - test & 输出电路布局图

Custom gates and Chip

本节我们以一个简单的电路为例，介绍 Halo2 中的自定义门(custom gates) 和 chip 的概念。

在上一节中，我们使用 Halo2 的 API 实现了只包含乘法门的简单电路，但是如果有多种 gate 呢，这种情况如何处理?

Custom gates

在 Halo2 中可通过自定义门(custom gate) 来实现，这里需要回顾下 Halo2 中自定义门(custom gate) 的 mental model ¹:

如上式，自定义门可以由任意多种不同的门线性相加构成，每一个门由选择器和门运算逻辑构成，如上式中第一个加法门选择器为 $q_{a dd}$ ，电路逻辑为 $a_{2} = a_{0} + a_{1}$ ，Halo2中可以通过 create_gate 创建每个门。不过需要注意的是，看起来这些门之间是独立的，但实际上这些门在最终的电路约束检查中会通过乘以一个随机数y，一次行检查一行的 witness 是否同时满足所有门的约束。

问题定义

本节则是证明如下电路:

#![allow(unused)]
fn main() {
private inputs: a,b,c
public inputs: out
constraints:
    d = a^2 * b^2 * c 
    e = c + d
    out = e^3
}

注意到在 vanilla plonk 中约束的 degree 不能超过 2（只支持加法门和乘法门，witness有三列,且门的2个输入和1个输出只能在一行），但 halo2 支持通过 Ultra plonk 来实现更高阶数以及使用更灵活的单元格的 custom gate。这里我们使用一个高阶 custom gate 来实现 $o u t = d^{3}$ 这条约束 (注: 其实 Ultra plonk 中乘法门和加法门也可以看作 custom gate，因此下文我们将该这条三次方约束的门称为立方门)，相比于原来需要 2 个乘法门实现该约束，custom gate 可以减少帮助约束的行数。

因此，我们可以画出电路 witness 表格:

ins	a0	a1	s_mul	s_add	s_cub
out	a
	b
	c
	a	b	1	0	0
	ab		0	0	0
	ab	ab	1	0	0
	absq		0	0	0
	absq	c	1	0	0
	d		0	0	0
	d	c	0	1	0
	e		0	0	0
	e	out	0	0	1

看到这里可能会产生疑问，这个 table 是如何填写出来的呢？其实，这个填写规则是与门约束一一对应的，而门约束可以很随意设计，所以关键是得确定

有几种门约束
每种门约束涉及哪几个单元格及多项式约束公式

完整代码见 Halo2 tutotials: chap_2/custom_gates

Config

首先，需要明确电路配置(CircuitConfig)，即选取所需的 Advices, Selectors 和 Instance 列，并在 fn configure 中创建相应的门。

#![allow(unused)]
fn main() {
#[derive(Debug, Clone)]
struct CircuitConfig {
    advice: [Column<Advice>;2],
    instance: Column<Instance>,
    s_mul: Selector,
    s_add: Selector,
    s_cub: Selector,
}

impl <F:Field> Circuit<F> for MyCircuit<F> {
    type Config = CircuitConfig;
    type FloorPlanner = SimpleFloorPlanner;

    fn without_witnesses(&self) -> Self {
        Self::default()
    }

    fn configure(meta: &mut ConstraintSystem<F>) -> Self::Config {
        let advice = [meta.advice_column(),meta.advice_column()];
        let instance = meta.instance_column();

        meta.enable_equality(instance);
        for c in &advice {
            meta.enable_equality(*c);
        }
        let s_mul = meta.selector();
        let s_add = meta.selector();
        let s_cub = meta.selector();

        meta.create_gate("mul_gate", |meta| {
            let lhs = meta.query_advice(advice[0], Rotation::cur());
            let rhs = meta.query_advice(advice[1], Rotation::cur());
            let out = meta.query_advice(advice[0], Rotation::next());
            let s_mul = meta.query_selector(s_mul);
            Constraints::with_selector(s_mul, vec![(lhs * rhs - out)])
        });

        meta.create_gate("add_gate", |meta| {
            let lhs = meta.query_advice(advice[0], Rotation::cur());
            let rhs = meta.query_advice(advice[1], Rotation::cur());
            let out = meta.query_advice(advice[0], Rotation::next());
            let s_add = meta.query_selector(s_add);
            Constraints::with_selector(s_add, vec![(lhs + rhs - out)])
        });

        meta.create_gate("cub_gate", |meta| {
            let lhs = meta.query_advice(advice[0], Rotation::cur());
            let out = meta.query_advice(advice[1], Rotation::cur());
            let s_cub = meta.query_selector(s_cub);
            Constraints::with_selector(s_cub, vec![(lhs.clone()*lhs.clone()*lhs - out)])
        });

        CircuitConfig {
            advice,
            instance,
            s_mul,
            s_add,
            s_cub
        }
    }
    ...
}
}

这里我们使用了新的 API —— Constraints::with_selector，其实等价于我们之前熟悉的 vec![selecter * gate expression] 。

填入 Witness

除了上述的加法门和乘法门之外，我们需要为立方运算增加一个填 witness 的辅助函数 fn cub :

#![allow(unused)]
fn main() {
...
fn cub<F:Field>(
    config: &CircuitConfig,
    mut layouter: impl Layouter<F>,
    a: Number<F>,
) -> Result<Number<F>, Error> {
    layouter.assign_region(
        || "cub", 
    |mut region| {
        config.s_cub.enable(&mut region, 0)?;
        a.0.copy_advice(|| "lhs", &mut region, config.advice[0], 0)?;
        let value = a.0.value().copied()*a.0.value().copied()*a.0.value().copied();
        region.assign_advice(|| "out=lhs^3", config.advice[1], 0, || value)
        .map(Number)
    })
}
...
}

注意: 推导并填入 witness 的方式一定要与上述自定义门中引用的单元格和计算方式一致，否则会导致欠约束或约束错误。

然后补充 Circuit Trait 中的 synthesis 函数:

#![allow(unused)]
fn main() {
impl <F:Field> Circuit<F> for MyCircuit<F> {
    ...
    fn synthesize(&self, config: Self::Config, mut layouter: impl Layouter<F>) -> Result<(), Error> {
        let a = load_private(&config,layouter.namespace(|| "load a"), self.a)?;
        let b = load_private(&config,layouter.namespace(|| "load b"), self.b)?;
        let c = load_constant(&config,layouter.namespace(|| "load c"), self.c)?;


        let ab = mul(&config,layouter.namespace(|| "a*b"), a, b)?;
        let absq = mul(&config,layouter.namespace(|| "ab*ab"), ab.clone(), ab)?;
        let d = mul(&config, layouter.namespace(|| "absq*c"), absq, c.clone())?;

        let e = add(&config, layouter.namespace(|| "absq + c"), d, c)?;
        let out = cub(&config, layouter.namespace(|| "absq^3"), d)?;

        //expose public
        layouter.namespace(|| "expose out").constrain_instance(out.0.cell(), config.instance, 0)
    }
}

}

测试

实例化电路，并调用相应的 Mock Prover 来验证。

#![allow(unused)]
fn main() {
cargo test test_simple_3gates
}

输出相应的电路布局图cargo test plot_3gates_circuit --features dev-graph: images

可以看出 Halo2 的 Simple Layouter 对乘法门选择器(s_mul) 和加法门选择器(s_add) 做了优化，将这两列合并为了 1 列。

Chip

在上述实现中，我们填入 witness 的函数和 Config 是分离的，为了更好地复用这些代码，类似于集成电路由很多个 Chip 构成，Halo2 一般将一系列紧密相关的实现特定约束的函数(config 以及相应的提供 witness 的函数) 抽象到一个 Chip 模块。

具体的代码参考在这里，这里我们简单对比一下 2 部分代码的区别：

在前部分的 custom_gate 的实现中：

手动定义了 load_private(), load_constant()
手动定义了 fn mul() / fn add()/ fn cub() 这几个处理 witness 的函数

#![allow(unused)]
fn main() {
// custom_gate.rs
fn load_private() { ... }
fn load_constant() { ... }
fn mul() / fn add() / fn cub() { ... }

impl <F: Field> Circuit<F> for MyCircuit<F> {
    fn configure()
    fn synthesize() {
        let (a, b) = load_private() ..;
        let ab = mul(a, b);
        // ...
    }
}
}

在本节的 simple_chip 的实现中:

将 load_private()、mul()、cub() 等操作直接封装到了 SimpleChip 中
在实现 MyCircuit 时，直接调用 SimpleChip 里的 configure() 来构建约束; 和 assign() 来填入 witness

#![allow(unused)]
fn main() {
impl <F: Field> SimpleChip<F> {
    fn configure()  // same as in custom_gate.
    fn assign() {
        // load_private:
        assign_region(
            assign_advice
        )
        // like fn mul / fn add() / fn cub()
        copy_advice() .. 
    }

impl <F: Field> Circuit<F> for MyCircuit<F> {
    let chip = SimpleChip::construct(config);
    let out = chip.assign(layouter.namespace(|| "simple ship"), self.a, self.b, self.c)?;
    chip.expose_public(layouter, out, 0)
}
}

建议仔细阅读、对比上下 2 部分代码，体会其在设计上的不同和 chip 这种模块化封装的思维。

我们将本节中的约束抽象为 SimpleChip，将原来独立的 assign witness 的几个函数 (load_private、load_constant、add、mul和cub) 合并到 Simple Chip 的 assign 方法中。此外，采用如下电路布局压缩所需的行数（在电路中我们只划分了了两个大的 region，这样就减小了复制 ab、absq、c 和 c 这四个约束） :

ins	a0	a1	s_mul	s_add	s_cub
out	a
	b
	c
	a	b	1	0	0
	ab	ab	1	0	0
	absq	c	1	0	0
	d	c	0	1	0
	e	out	0	0	1

完整代码见 Halo2 tutorials: chap_2/simple_chip

test & 输出电路布局图

#![allow(unused)]
fn main() {
cargo test test_simple_ship
cargo test plot_chip_circuit --features dev-graph
}

采用 Chip 的电路布局图为: images

references:

0xPARC halo2 lectures https://learn.0xparc.org/halo2/

作者: @Po@Ethstorage.io

时间: 2023-10-24

校对: @Demian

进阶电路布局

进阶电路布局

在之前的教程中，电路行数相对较少，且相邻 region 之间所采用的 custom gate 也不一样，因此我们可以一行行地手动填入 witness 。本节，我们则考虑相邻 region 都是采用同一种门的电路——Fibonacci 数列，学习采用循环来复用函数填入 witness 代码；

在此之后，考虑另一种电路布局的 Fibonacci 电路实现，来初步体会如何优化设计电路布局。

Fibonacci

问题定义

Fibonacci 数列是证明如下问题:

public inputs: a, b, f(N)  
constraints: 
    f(0) = a
    f(1) = b
    f(n) = f(n-1) + f(n-2), n = 2,...,N

注意：N 为 struct Circuit 中的电路配置，它不是电路结构的一部分，只是用来辅助生成电路，不同的 N 对应着不同的电路，N 确定之后，可以认为电路的 verification key 就确定了。代码如果开源，任何人都可以阅读到这个 N 的取值。

举个例子， $a = 1, b = 1, o u t = 55$ 是已知的 public input，Prover 想生成一个 proof，证明他知道 $f (N) = o u t$

这里读者可能会有疑问，我都能口算出来的结果，还有必要 Prove 嘛？这里不必过分纠结这个例子的实际用途，暂时 focus 到 Halo2 API 和电路布局即可，后面也会讲解到更加 make sense 的进阶电路 ~

对于该电路例子，我们采用只包含一列 Advice 的电路配置，使用上下相邻三行单元格组成的加法门，并且只划分为一个大 region , 在 region 内部通过 offset 来确定要填入的单元格。

Fibonacci 电路的 witness 表格为:

instance	a0	seletor
a	f(0)=a	1
b	f(1)=b	1
out	f(2)	1
	f(3)	1
…
	f(n-2)	1
	f(n-1)	0
	f(n)=out	0

为什么 advice 中， f(n-1) 行没有约束 selector？ —— 这一点后面会讲到。

完整代码参考

Config

如前所述，电路配置只需一列 Advice 和一列 selector, 我们将此电路定义为 FiboChip。

#![allow(unused)]
fn main() {
#[derive(Debug, Clone)]
struct FiboChipConfig {
    advice: Column<Advice> ,
    instance: Column<Instance>,
    selector: Selector,
}

#[derive(Debug, Clone)]
struct FiboChip<F:Field>{
    config: FiboChipConfig,
    _marker: PhantomData<F>
}

#[derive(Debug, Clone)]
struct ACell<F:Field> (AssignedCell<F,F>);

impl <F:Field> FiboChip<F> {
    fn construct(config: FiboChipConfig) -> Self {
        FiboChip {
            config,
            _marker: PhantomData,
        }
    }

    fn configure(
        meta: &mut ConstraintSystem<F>,
        advice: Column<Advice> ,
        instance: Column<Instance>,
    ) -> FiboChipConfig {
        let selector = meta.selector();
        meta.enable_equality(advice);
        meta.enable_equality(instance);

        meta.create_gate(
            "fibo gate", 
            |meta| {
                let cur_row = meta.query_advice(advice, Rotation::cur());
                let next_row = meta.query_advice(advice, Rotation::next());
                let third_row = meta.query_advice(advice, Rotation(2)); 
                let s = meta.query_selector(selector);
                vec![s*(cur_row + next_row - third_row)]
            }
        );

        FiboChipConfig {
            advice,
            instance,
            selector
        }
    }
    ...
}
}

为`FiboChip` 增加填入 witness 的方法 `assign_witness`

这里我们假设 FiboChip 计算的行数 nrow 由调用它的电路提供。然后通过 mut f_pre 和 mut f_cur 结合 for 循环一行行填入 witness。

#![allow(unused)]
fn main() {
impl <F:Field> FiboChip<F> {
    ...
    fn assign_witness(
        &self,
        mut layouter: impl Layouter<F>,
        nrow: usize
    ) -> Result<ACell<F>, Error> {
        layouter.assign_region(
            || "fibo",
            |mut region| {
                let instance = self.config.instance;
                let advice = self.config.advice;
                let selector =  self.config.selector;
                selector.enable(&mut region, 0)?;
                selector.enable(&mut region, 1)?;
                let mut f_pre = region.assign_advice_from_instance(
                    || "f0", instance, 0, advice, 0).map(ACell)?;
                let mut f_cur = region.assign_advice_from_instance(
                    || "f1", instance, 1, advice, 1).map(ACell)?;
              
                for i in 2..nrow{
                    if i < nrow -2 {
                        selector.enable(&mut region, i)?;
                    }
                    let value = f_pre.0.value().copied() +  f_cur.0.value();
                    let f_next = region.assign_advice(
                        || "fn", advice, i, || value).map(ACell)?;
                    f_pre = f_cur;
                    f_cur = f_next;

                }
                Ok(f_cur)
            }
        )
    }
}
}

核心逻辑：

如果 i 小于 nrow - 2，则启用选择器 Selector。这意味着 Selector 只对数列的前 nrow - 2 个数字启用
计算下一个斐波那契数 f_next 为前两个数字 f_pre 和 f_cur 之和，并将其分配到 advice column
更新 f_pre 和 f_cur ，为下一次迭代使用

注意: 最后两行不需要 enable selector 了，因为这里使用的门约束的是相邻的三个 row，输出值 f(N) 已经在第 n-2 个行的门中被约束了。

实现 Circuit Trait

最后使用 FiboChip 来创建 FiboCircuit 电路，并实现 Circuit Trait:

#![allow(unused)]
fn main() {
#[derive(Debug, Clone,Default)]
struct FiboCircuit<F:Field> {
    nrow: usize,
    _marker: PhantomData<F>
}

impl <F:Field> Circuit<F> for FiboCircuit<F> {
    type Config = FiboChipConfig;
    type FloorPlanner = SimpleFloorPlanner;

    fn without_witnesses(&self) -> Self {
        FiboCircuit::default()
    }

    fn configure(meta: &mut ConstraintSystem<F>) -> Self::Config {
        let advice = meta.advice_column();
        let instance = meta.instance_column();
        FiboChip::configure(meta, advice, instance)
        
    }
    fn synthesize(&self, config: Self::Config, mut layouter: impl Layouter<F>) -> Result<(), Error> {
        let chip = FiboChip::construct(config);
        let out = FiboChip::assign_witness(&chip, layouter.namespace(|| "fibo table"), self.nrow)?;
        //expose public
        layouter.namespace(|| "out").constrain_instance(out.0.cell(), chip.config.instance, 2)
    }
}
}

注意: 具有不同 nrow 的FiboCircuit 实际上对应的是不同的电路。

电路布局图为: images

另一种 Fibonacci 电路布局

Halo2 中电路的布局主要与怎么设计门有关，需要在如下变量之间权衡:

witness 多少列
selector 多少列
门的 dgree、门的输入输出需包含哪些相邻单元格

上一小节我们采用 1 列 witness 、1 个 selector 和包含相邻三个单元格的加法门，这次我们则选择 2 列 witness 、1个 selector 和相邻两行四个单元格组成的门，来重新设计 Fibonacci 电路。电路的 witness 表格设计如下:

ins	a0	a1	seletor
a	f(0)=a	f(1)=b	1
b	f(2)=b	f(3)	1
out	f(4)	f(5)	1
…
	f(2n/2)	f(2n/2+1)	1
其中 n 依然为 Fibonacci 计算的 f(n) , 这里需要注意最后一行，我们即使在 n 为偶数也将这行填满，同时根据 n 是否为奇数来约束out： `out === n % 2 == 0 ? f(2n/2) : f(2n/2 + 1)`

完整代码见Halo2 tutorial: chap_3/circuit_2.rs

其他的代码与上一小节基本类似，这里只对使用到的 custom gate 进行说明:

#![allow(unused)]
fn main() {
    meta.create_gate( "fibo gate", |meta|{
        let s = meta.query_selector(selector);
        let cur_left = meta.query_advice(advice[0], Rotation::cur());
        let cur_right = meta.query_advice(advice[1], Rotation::cur());
        let next_left = meta.query_advice(advice[0], Rotation::next());
        let next_right = meta.query_advice(advice[1], Rotation::next());
        Constraints::with_selector(s, 
            vec![
                (cur_left + cur_right.clone() - next_left.clone()), 
                (cur_right + next_left - next_right)]
            )
    });
}

这里我们使用了 Constraints::with_selector 的一个更高级用法，使得当 selector enable 时，如下两个约束需同时成立:

f(2n-2) + f(2n-1) = f(2n)
f(2n-1) + f(2n) = f(2n+1)

电路布局图为: images

总结

不同的电路布局没有绝对的优劣之分，它们都是在行数、列数、degree 、permuation 包括后面会涉及到的 lookup 等进行权衡，最终这些决定了 prover 计算成本与 proof 大小之间的权衡。

作者: @Po@Ethstorage.io

时间: 2023-10-31

校对: @Demian

lookup

lookup

前面的章节中我们介绍了 Halo2 的 API 和电路布局等核心概念，这节则介绍 Plonk 证明系统中基于 permutation argment 抽象出的一个强大功能 lookup 。Halo2 中使用的 lookup 对 plookup 进行了简化，可以约束一列或多列的 cells 的值属于对应的 lookup 列。

如下图，我们可以通过 lookup 约束 $w_{0}, w_{1}$ 两列中的第 1、3 行属于查找表( $t_{0}, t_{1}$ 列)中的某一行; 对于不需要查找的则约束其属于查找表的某个默认行（自己指定）。 images

关于 Zcash 版本的 lookup，有两个问题需要注意:

多列 lookup 不同列的相同行必须同时存在于查找表中，Halo2 底层通过一个随机数将各列对应行的 row 组合起来使其回归到单列 lookup;
多列 lookup 时，需约束的多列 witness 不一定在同一行（如下图中的 $W_{0}$ 在第一行， $W_{1}$ 在第二行，这 2 个 witness 不同行），但是查找表中对应的所有列是在同一行（在 lookup table 中 2 个 witness 对应的 42, SHA(42) 是需要再同一行的）。比如上述例子也可以进行如下的 lookup:

同时可参考对不在同一行的两列进行 lookup 的示例代码: halo2-tutorials/chap_4/circuit_1。

单列 lookup

首先从最简单的单列 lookup 介绍如何使用 lookup API。我们的目的是证明 a[N] 数组里的每一个 value 都在 [0, RANGE] 这个范围里面：

private inputs: a[N]
constant: RANGE
s.t: a[i] ∈ [0, RANGE], ∀ i ∈ [0, N-1]

若直接采用 gate 约束的话，我们需要设计形如

$(a [i] - 0) * (a [i] - 1) * (a [i] - 2) \dots (a [i] - R A NGE) = 0, \forall i \in [0, N - 1]$

这样一个连乘表达式约束的电路，这种方式固然直观，但问题在于：当 RANGE 很大时 (比如 $2^{16}$ )，电路的 degree 会很高, 这会导致整个 proof 很大。

因此，我们可以采用 lookup 方式实现（回忆 permutation argument 只会将 degree 增加 1)，将 $[0, R A NGE]$ 这些值填入 TableColumn 中 ( Zcash 版本的 Halo2 只支持静态查找表, 因此只能填入 TableColumn)，并借助 lookup API 来证明所有的 a[i] 属于该 TableColumn 的某一行。

整个电路结构如下:

adv	q_lookup	table
a[0]	1	0
a[1]	1	1
a[2]	1	2
a[3]	1	3
a[4]	1	4
…	…	…
a[N]	1	N-1
	0	N
	…	…
	0	RANGE

完整代码见: halo2-tutorials/chap_4/circuit_2

电路配置及 lookup 约束

如上表电路需要 1 列 Advice , 1 列 TableColumn, 1 列 Selector :

#![allow(unused)]
fn main() {
#[derive(Debug, Clone)]
struct RangeConfig<F:PrimeField, const RANGE: usize, const NUM: usize>{
    value: Column<Advice>,
    table: LookUpTable<F, RANGE>,
    q_lookup: Selector,
}
}

该电路配置定义为 RangeConfig，将其中的查找表单独定义为 LookUpTable。下面代码的 [(q_lookup * v, table.table)] 即表示：当 q_lookup 启用时，v 需要存在于 table 查找表中。相应代码为:

#![allow(unused)]
fn main() {
impl <F:PrimeField, const RANGE: usize, const NUM: usize> RangeConfig<F, RANGE, NUM>{
    fn configure(meta: &mut ConstraintSystem<F>,value: Column<Advice>) -> Self {
        let q_lookup = meta.complex_selector();
        let table = LookUpTable::<F,RANGE>::configure(meta);
        meta.lookup(|meta| {
            let q_lookup = meta.query_selector(q_lookup);
            let v = meta.query_advice(value, Rotation::cur());
            vec![(q_lookup * v, table.table)]
        });

        RangeConfig {value, table, q_lookup}
    }
    
    fn assign(
        &self,
        mut layouter: impl Layouter<F>,
        value: [Value<Assigned<F>>;NUM]
    ) -> Result<ACell<F>,Error> {
        
        layouter.assign_region(|| "value to check", |mut region|{ //instantiate a new region, so it's not ref
            self.q_lookup.enable(&mut region, 0)?;
            let mut cell= region.assign_advice(||"value", self.value, 0, || value[0]).map(ACell);
            for i in 1..value.len() {
                self.q_lookup.enable(&mut region, i)?;
                cell = region.assign_advice(||"value", self.value, i, || value[i])
                .map(ACell);
            }
            cell
        })
    }
}

}

lookup 必须使用 complex_selector，因为 Halo2 可以根据这个标记知道这种 Selecotr 列不需要优化，而普通的 Selector 则可能会被 Layouter 进行合并等优化操作。

对于 LookUpTable, 使用 assign_table 来填充 witness :

#![allow(unused)]
fn main() {
#[derive(Debug, Clone)]
pub(crate) struct LookUpTable<F:PrimeField, const RANGE: usize> {
    pub(crate) table: TableColumn,
    _maker: PhantomData<F>
}

impl <F:PrimeField, const RANGE: usize> LookUpTable<F, RANGE> {
    pub fn configure(meta: &mut ConstraintSystem<F>) -> Self {
        let table = meta.lookup_table_column();
        Self {table, _maker: PhantomData }
    }

    pub fn load(&self, layouter: &mut impl Layouter<F>) -> Result<(), Error>{
        layouter.assign_table( || "load range lookup table", 
        |mut table|{
            for value in 0..RANGE{
               table.assign_cell(||"table cell", self.table, value, || Value::known(F::from(value as u64)))?;
            }
            Ok(())
        })
   
    }
}
}

电路具体的 Trait 方法实现就比较简单了，在此不再赘述。

多列 lookup

还可以对多列 witness 与对应的多列查找表进行 lookup 约束。本小节考虑如下例子: 证明某个值只有 bit[N] 比特位:

private inputs:  a[N], bit[N]
s.t: a[i] ≤ 2^bit[i] -1，  ∀ i ∈ [0, N-1]

具体来说，假设对于一个 8 位的查找表，它可以存储 $2^{8} = 256$ 个可能的值（即 [0,255] ），但我们并不总是需要用所有 256 个值，也就是即使查找表可以存储 8 位的值，我们也可以使用它来约束小于 8 位的值。

例如，对于一个 1 位的值，我们只需查找两种可能的值（0 或 1）；对于一个 2 位的值，我们可以查找四种可能的值（00、01、10 或 11）…

举个具体的例子：比如某 Prover 想证明其 value 确实只有 5 位 (即 value <= 2^5 - 1 = 31 ) ，

(value = 31/32, bit = 5 ) 是 private value.
对于 value = 31，其二进制表达为 11111，确实只有 5 位，满足约束
对于 value = 32，其二进制表达为 100000，其位数到达了 6 位，但是 Prover 填入电路的 bits 是 5 ，(这里你可以认为这是一个 malicious Prover)，它想作弊，但这是不可能的！ Prover 传入的这 2 个 private inputs 不满足 lookup table 在该处的约束。

我们可以设计两列TableColumn, 其中一列 lookup table 为整数值 table_value，另一列为其对应的 bit 位数 table_n_bits；

并约束 witness 中值那一列 value 和比特位那一列 bit 属于前述的两列 TableColumn lookup table

value	bit	q_lookup	table_n_bits	table_value
v[0]	0	1	1	0
v[1]	1	1	1	1
…	…	…	2	2
…	…	…	2	3
…	…	…	3	4

完整代码见: halo2-tutorials/chap_4/circuit_3

电路配置

这里我们重点关注 lookup 约束相关代码:

#![allow(unused)]
fn main() {
#[derive(Debug, Clone)]
struct RangeCheckConfig<F:PrimeField, const NUM_BITS: usize, const RANGE: usize>{
    value: Column<Advice>,
    bit: Column<Advice>,
    q_lookup: Selector,
    table: RangeCheckTable<F, NUM_BITS, RANGE>
}

impl <F:PrimeField, const NUM_BITS: usize, const RANGE: usize> RangeCheckConfig<F, NUM_BITS, RANGE> {
    fn configure(meta: &mut ConstraintSystem<F>, ) -> Self {
        //when to configure the colum, during config or circuit instance: configure time
        let value = meta.advice_column();
        let bit = meta.advice_column();
        let q_lookup = meta.complex_selector();
        let table = RangeCheckTable::configure(meta);

        meta.lookup(|meta|{
            let default_value = Expression::Constant(F::ZERO);
            let default_bit = Expression::Constant(F::ONE);
            let mut v = meta.query_advice(value, Rotation::cur());
            let mut b = meta.query_advice(bit, Rotation::cur());
            let q = meta.query_selector(q_lookup);
            let non_q = Expression::Constant(F::ONE) - q.clone();
            v = v*q.clone() + non_q.clone()*default_value;
            b = b*q + non_q*default_bit;
            vec![(b, table.n_bits),(v, table.value)]
        });

        RangeCheckConfig { value,bit, q_lookup, table }
    }
...
}
}

这里我们对于不需要 lookup 的行为其指定默认值保证所有行均满足 lookup 约束， vec![(b, table.n_bits), (v, table.value)] 则范围两组对应的(cell expression, lookup table)。

多列错行 lookup table

如下图所示，假若想约束的的 2 列 witness 不在同一行，而是错行的：

images

对于这种情况 halo2 也可以灵活地处理：

#![allow(unused)]
fn main() {
impl<F: PrimeField> LookupChip<F> {
    fn construct(config: LookupConfig) -> Self {
        LookupChip {
            config,
            _marker: PhantomData,
        }
    }

    fn configure(meta: &mut ConstraintSystem<F>) -> LookupConfig {
        let a = meta.advice_column();
        let b = meta.advice_column();
        let s = meta.complex_selector();
        let t1 = meta.lookup_table_column();
        let t2 = meta.lookup_table_column();

        meta.enable_equality(a);
        meta.enable_equality(b);

        meta.lookup(|meta| {
            let cur_a = meta.query_advice(a, Rotation::cur());
            let next_b = meta.query_advice(b, Rotation::next());
            let s = meta.query_selector(s);
            // we'll assgin (0, 0) in t1, t2 table
            // so the default condition for other rows without need to lookup will also satisfy this constriant
            vec![(s.clone() * cur_a, t1), (s * next_b, t2)]
        });

        LookupConfig { a, b, s, t1, t2 }
    }

    fn assign(
        &self,
        mut layouter: impl Layouter<F>,
        a_arr: &Vec<Value<F>>,
        b_arr: &Vec<Value<F>>,
    ) -> Result<(), Error> {
        layouter.assign_region(
            || "a,b",
            |mut region| {
                for i in 0..a_arr.len() {
                    self.config.s.enable(&mut region, i)?;
                    region.assign_advice(|| "a col", self.config.a, i, || a_arr[i])?;
                }

                for i in 0..b_arr.len() {
                    region.assign_advice(|| "b col", self.config.b, i, || b_arr[i])?;
                }

                Ok(())
            },
        )?;
}

在上面的代码中，

利用 [(s.clone() * cur_a, t1), (s * next_b, t2)] 这 2 个需要同时成立的约束，我们同时约束了 a 的当前行和 b 的下一行需要存在于多列查找表中。
在 assign 函数中，我们只对 advice column a 进行了约束，而没有对 advice column b 应用 selector，目的是只对 a 有值的这些行进行约束。如此就给 b 列提供了更多的灵活性。

#![allow(unused)]
fn main() {
    #[test]
    fn test_lookup_on_different_rows() {
        let k = 5;
        let a = [0, 1, 2, 3, 4];
        let b = [0, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9];
        let a = a.map(|v| Value::known(Fp::from(v))).to_vec();
        let b = b.map(|v| Value::known(Fp::from(v))).to_vec();
        let circuit = MyCircuit { a, b };
        let prover = MockProver::run(k, &circuit, vec![]).unwrap();
        prover.assert_satisfied();
    }
}

如上代码，只对 a 列有值的情况进行了约束，b 列的取值变得灵活。

lookup Debug 相关

在 lookup 电路设计时，以典型的 halo2-tutorials/chap_4/circuit_1 为例，可能会遇到如下报错:

#![allow(unused)]
fn main() {
error: lookup input does not exist in table
  (L0, L1) ∉ (F0, F1)

  Lookup inputs: 每一个 lookup 会出现这一行,整个 lookup 分为两组: L0 和 L1
    L0 = x1 * x0 :，这是第一组 (witness: A0 列, table: F2 列), 电路中为`(b, table.n_bits)`
    ^
    | Cell layout in region 'a b':
    |   | Offset | A0 | F2 |
    |   +--------+----+----+
    |   |    1   | x0 | x1 | <--{ Lookup inputs queried here
    |
    | Assigned cell values:
    |   x0 = 1
    |   x1 = 1

    L1 = x1 * x0 : 这是第二组 (witness: A0 列, table: F2 列), 电路中为 `(v, table.value)`
    ^
    | Cell layout in region 'a b':
    |   | Offset | A1 | F2 |
    |   +--------+----+----+
    |   |    1   |    | x1 | <--{ Lookup inputs queried here
    |   |    2   | x0 |    |
    |
    | Assigned cell values:
    |   x0 = 0x3
    |   x1 = 1
}

理解上述报错，可以让我们更快地调试。报错结构如何理解在上图中均已表明，且 cell 的相对值也体现的很清楚(注意 L1 中的 x0 相对 L0 中的 x0 向下偏移了 1 , 这与电路一致)。

动态查找表 `PSE Halo2's lookup_any API`

注意到使用 Zcash 版本 Halo2 进行 lookup 约束时，由于没法对 TableColumn 进行 query_advice这导致除了 lookup 约束外，无法灵活地对 TableColumn 中的 cell 进行 gate 约束，即TableColumn必须在电路初始化阶段写死，无法再更改了，即只能进行静态查找。

因此，Zcash 团队的核心开发者为 PSE Halo2 版本开发了 lookup_any API, 使其也支持对任意类型的列，如Advice、FixedColumn 等进行 lookup, 即实现了动态查找表。lookup_any 使用方式与 lookup 没有太大的区别，来看其具体的一些例子

下面的代码中，定义了 2 个 lookup table： instance_table & advice_table :

#![allow(unused)]
fn main() {
	#[test]
	fn bad_lookup_any() {
	
		impl Circuit<Fp> for FaultyCircuit {
			fn configure(meta: &mut ConstraintSystem<Fp>) -> Self::Config {
				let instance_table = meta.instance_column(); // lookup as Instance Columns
				let advice_table = meta.advice_column();
				let a = cells.query_advice(a, Rotation::cur());
				
                meta.annotate_lookup_any_column(instance_table, || "Inst-Table");
                meta.enable_equality(instance_table);
                meta.annotate_lookup_any_column(advice_table, || "Adv-Table");
                meta.enable_equality(advice_table);

                meta.lookup_any("lookup", |cells| {
                    let advice_table = cells.query_advice(advice_table, Rotation::cur());
                    let instance_table = cells.query_instance(instance_table, Rotation::cur());
				// ..
                    vec![
                        (
                            q.clone() * a.clone() + not_q.clone() * default.clone(),
                            instance_table,
                        ),
                        (q * a + not_q * default, advice_table),
                    ]});
		}
		// ...
	let custom_lookup_table = vec![vec![
			Fp::from(1u64),
			Fp::from(2u64),
			Fp::from(4u64),
			Fp::from(6u64),
		]];
	let prover = MockProver::run(
			K,
			&FaultyCircuit {},
			// This is our "lookup table".
			custom_lookup_table,
		)
		.unwrap();
		assert_eq!(
			prover.verify(),
			Err(vec![VerifyFailure::Lookup {
				name: "lookup".to_string(),
				lookup_index: 0,
				location: FailureLocation::InRegion {
					region: (1, "Faulty synthesis").into(),
					offset: 1,
				}
			}])
		);
	}
}

如上代码的动态查找表中：

2 个 lookup table 在 Circuit configure 阶段被分别定义为了 instance column 和 advice columns，而后在 “lookup” 门约束中（lookup_any()），advice col a 须满足 2 个约束：
- a 需能在 lookup table instance_table 中被查找到，且同时也
- 能在 lookup table advice_table 中被查找到
在 synthesize() 阶段，advice_table 这个 lookup table 由 instance col 生成（可以理解为复制了一份 instance_table 到 advice_table ）
- 在 “Good synthesis” 中，advice 的赋值都能在 2 个 lookup tables 中被查找到，满足约束；
- 而在 “Faulty synthesis” 中，Fp::from(5) 这个 advice 赋值不能在 lookup tables 中被查找到，所以不满足约束。
Prover 在 prove 阶段，可以将 Public Input(PI) 或 advice column(witness) 作为 lookup table，这种方式提供给了 halo2 电路更大的灵活度。

除此之外，还可以参考brainfuck zkvm的例子。

ref: https://scroll.io/blog/proofGeneration#user-content-fnref-2

ref: @Ye sharing at 0xPARC

translator: Demian

Builing blocks

表示 Polynomial 的 2 种方式：

coefficients form: $f (x) = a_{0} + a_{1} x + a_{2} x^{2} + \dots + a_{n - 1} x^{n - 1}$
evaluation form: $f (x) = (x_{0}, f (x_{0})), (x_{1}, f (x_{1})), \dots, (x_{n - 1}, f (x_{n - 1}))$

多项式计算 -> FFT & iFFT

通过 FFT，将系数形式的多项式转化为评估形式；
通过 iFFT，将评估形式的多项式转化为系数形式；

多项式乘法 multiplication:

$iFFT (FFT (f (x)) ⊙ FFT (g (x)))$
通过 evaluation form 相乘是比较好计算的，只需要将相同 x 坐标的对应的 y 坐标相乘， x 坐标保持不变，从而完成多项式乘法计算。

多项式除法 division (vanishing polynomial): $h (x) = \frac{f ( x ) \cdot g ( x )}{x ^{n} - 1} h (σ ω^{i}) = \frac{f ( σ ω ^{i} ) g ( σ ω ^{i} )}{( σ ω ^{i} ) ^{n} - 1} coset-iFFT (\frac{coset-FFT ( f ( x )) ⊙ coset-FFT ( g ( x ))}{σ ^{n} - 1})$

如上公式，对于 $x^{n} - 1$ ，如果我们知道 $ω^{i} - 1 = 0$ ，那么 $x^{n} - 1 = 0$ ，因为不可以除 0，所以这里会有一些问题。
解决方案是使用 coset-fft，即通过 $σ$ 做一次 shifted ，这样 $(σ ω^{i})^{n} - 1$ 就不会等于 0 了，而是等于某些常数形式，如此就可以正常进行除法操作。

承诺 Commitment -> MSM (Multiexp)

MSM: 即将标量向量 (scalar vector) 和椭圆曲线上的点 (point vector) 做点乘

Commit to a polynomial

对于 $f (x) = a_{0} + a_{1} x + a_{2} x^{2} + \dots + a_{n - 1} x^{n - 1}$
$Coefficient: [f]_{1} = a_{0} [g^{0}]_{1} + a_{1} [g^{s}]_{1} + a_{2} [g^{s^{2}}]_{1} + \dots + a_{n - 1} [g^{s^{n - 1}}]_{1}$
$Lagrange: [f]_{1} = f (x_{0}) [L_{0}]_{1} + f (x_{1}) [L_{1}]_{1} + f (x_{2}) [L_{2}]_{1} + \dots + f (x_{n - 1}) [L_{n - 1}]_{1}$

对于多项式的承诺形式，可以分别使用 coefficient 和 Lagrange 形式表示，其中

👆🏻 $[g^{0}]_{1}, [g^{s}]_{1} \dots$ 是 SRS，通过系数 vector 和 srs 相乘的方法，得到 coefficient form 的 commitment。

$L_{n - 1}$ 是 Lagrange Basis，下文中会有详细解释

Square-Fibonacci

我们将在本文中使用如下 Square-Fibonacci 示例，来演示证明生成的过程和在其中的计算成本 (cost)

设 $f_{0} = 1$ , $f_{1} = 1$
对于 $i \geq 2$ , 定义 $f_{i} := (f_{i - 2})^{2} + (f_{i - 1})^{2} (mod q)$
- $q$ 是一个大素数。使用这个 $q$ 来限制元素大小，以便它可以用一些预定的 bits 来表示
设 $n$ 为大整数，为了方便 FFT 计算，不妨假设 n 是 2 的幂。
设 $k$ 为第 $n^{t h}$ 个 Square-Fibonacci number.

目标：生成一个可被高效验证 (efficiently-verifiable) 的证明 $π$ ，来证明其确实是第 $n^{t h}$ 个 Square-Fibonacci 数（即 Prove $f_{n} = k$ ）

验证者可以朴素(naively) 地自己计算 $f_{2}$ , $f_{3}$ … $f_{4}$ … 一直算到 $f_{n}$ ，然后自己检查是否 $f_{n} = k$ 来检查该 statement。然而，这需要许多计算步骤（注意 $n$ 非常大），不是理想的方法。

The phases of proof generation

在 high level 层面上，证明生成（proof generation）由 3 个阶段组成：

phase 1: 填入 witness
phase 2: commit to the witness
phase 3: prove that the witness 是正确的

phase 1: 填入 witness:

witness (或者说 trace) 指的是一组数据，可以展示为什么某个 statement 是正确的。
- 例如，在 Square-Fibonacci 示例中，我们可以在 trace table 中逐步写出计算结果，每行一步：
  - 第一行： $[f_{0}, f_{1}, f_{2}]$ , where $f_{2} = (f_{0})^{2} + (f_{1})^{2}$
  - 第二行： $[f_{1}, f_{2}, f_{3}]$ , where $f_{3} = (f_{1})^{2} + (f_{2})^{2}$
  - … 以此类推，直到到达 $[f_{n - 2}, f_{n - 1}, f_{n}]$

phase 2: commit to the witness

对 witness 的 commitment 涉及到输出 witness 的一些简洁表示 (succient representations)，并在此意义上压缩 witness
在这一步中使用多项式承诺方案 (polynomial commitment scheme) 使我们能够仅通过简洁的承诺 (succinct commitment) 来证明 original witness 里 referencing 的某些属性。

phase 3: prove that the witness 是正确的

phase 1 阶段生成的 witness 必须遵从某些特定属性才能认证为 valid
- 在 Square-Fibonacci case 中，每一行都需要满足约束: $f_{i} := (f_{i - 2})^{2} + (f_{i - 1})^{2}$
如若 original witness 满足了这些约束，那么一个简短的 proof 就可以被正常生成
验证 proof 不需要访问 original witness table - 验证可以做到仅参考在 phase 2 生成的 succinct commitment 来进行。

Phase 1: 填入 trace table

filling in the trace table

trace table 是一个二维矩阵，其中记录了 “Witness” 或者说 “trace”。除了 Witness 之外，trace table 还包括其他值（比如 fixed columns 或 Public Input），这些值有助于证明 Witness 是正确的。 trace table 中的每个 Cell 都是大有限域 $F_{q}$ 中的一个元素

对于示例，trace table 可能如下所示：

如上图，

$A / B / C$ 代表 witness data (aka. private value)；
$S$ 表示 Selector，当它启用时，该处必须要满足定义好的某种数学关系（custom gate）。注意在最后一行，witness 是空的，所以 $S$ 被关闭了，这里加入空行只是为了方便—— 让表的高度（行数）能达到 2 的幂次。
$P$ 即代表 Public Input，是众所周知的公共输入：
- $f_{1}, f_{2}$ 是大家都知道的；
- $k$ 是 the value in the statement to be proved.

witness generation

实际 filling in the trace table 的过程就是 witness generation 的过程，不要忘了，填表过程中的算术运算是在大有限域上实现的，这种运算比在原始类型（如 int or long.）上昂贵得多。

有限域上的字段元素通常需要约 ~256 位来表示，这比 modern CPU 的字长要大得多。

Having to split each element’s representation across words,
in addition to needing to compute all values modulo $q$ , adds a computational overhead to each arithmetic operation.

在本例中，使用 $f_{i + 2} = (f_{i})^{2} + (f_{i + 1})^{2} (mod q)$ 做约束运算，就需要 $F_{q}$ 上的乘法和加法。不过这个约束会在每一行上不断重复应用，是相对特殊的用例。

在更常见用例中， witness 计算所需要的计算会非常复杂，可能其单独一步的计算就需要很多 witness rows (某些情况下 > 1000 行）。这种更复杂的表示或算术化（Arithmetization）通常会导致 trace table 的大小显着增加。那么 proof generation 所需的时间和计算量也会随之增加。

Additional processing

一旦 witness data (or “private input”) 被填入并被 committed to, 就会对 trace table 进行一些额外处理：

Auxiliary columns (也被称为 “virtual columns”) 是为了方便证明 trace 的有效性而生成的额外列。某些类型的约束（constraints）需要这些 Auxiliary columns 来辅助。

举个例子： wiring constraints ，这个约束会强制要求 trace table 中的某些 Cells 采用相同的值。即使用 Permutation argument 来实现 Copy Constraints

回顾 PLONK 协议，在 high level 层面，在 Permutation argument 过程中，根据 witness 计算出的累积多项式（accumulator polynomial）就会以 evaluation form 的形式存储在 Auxiliary column $Z$ 中，而后，证明 wire constraints 成立就简化为证明 $Z$ 上的某些约束成立，以及 $Z$ 与其他 witness column 的关系。

另一种需要 Auxiliary column 的约束是查找表(lookup table)。查找表由 plookup 于 2020 年首次推出，可实现高效的 set-membership 检查。除了算术运算之外，用于查找的 Auxiliary column 生成所需的计算还可能涉及排序。

请注意，辅助列 Auxiliary column 仅在 witness data 完全生成（generated）并提交（committed to）后才进行计算。

Auxiliary column 不仅取决于 witness data ，还取决于一些额外的随机性。这种随机性是使用 Fiat-Shamir heuristic 启发式计算的，其所依赖的 transcript 包括了对 witness data 的 commitment。

Phase 1 cost summary

Enter witness data into trace table
- 迭代并填充 all witness cells in trace table
- 计算 witness values 需要大量的有限域运算
生成用于 wiring constraints 和 lookup constraints 的 auxiliary columns
- 需要额外的 large finite field arithmetic (as well as sorting, in the case of lookups)

Phase 2: Committing to the trace table

trace table 插值为多项式

考察 trace table 中的 Column $A$ , 我们可以将 A 列视为有限域中 (n−1) 次唯一多项式的求值形式 (evaluation form)： $A$ 中的第 $i^{t h}$ 个值对应着其 evaluation $A (ω^{i})$ 。这就是 evaluation form 的列多项式们（包括 Auxiliary column $Z$ ）:

通过对 $A$ 的 evaluation form (iFFT, evaluation form 2 coefficient form) : $[(ω^{0}, A (ω^{0})), (ω^{1}, A (ω^{1})), \dots, (ω^{n - 1}, A (ω^{n - 1}))]$

的拉格朗日插值，我们可以得到 $A (X)$

Commit to column polynomials

现在我们有了每一列的 Polynomials 的 coefficient form（系数），可以使用 polynomial commitment scheme(PCS) 来 commit 它们中的每一个。这允许我们将每一列都 “压缩”成一个简短的表示。对所有列执行此操作，会生成整个 trace table 的简洁表示（succinct representation）

使用 PCS 还允许我们生成 proofs of evaluation - Prover 可以说服 Verifier 它承诺的多项式穿过了某个特定点，而无需透露整个多项式。

Computing KZG commitments

设 $τ \in F_{p}$ 表示 KZG trusted setup ceremony 中的 secret value，写做 $([τ^{0}]_{1}, [τ^{1}]_{1}, [τ^{2}]_{1} \dots, [τ^{l}]_{1})$

notation: $[r]_{1}$ 表示 $r \cdot g$ , $g$ 是椭圆曲线群 $G_{1}$ 的生成元
注意: $l$ 是可以从 setup 中 committed 的多项式的上限(upper bound)，如果多项式再大的话，可能需要更换一个更高度数的 $τ \in F_{p}$

现在我们有了每一列的多项式系数表达形式，如 $A (x)$ ，对其进行承诺(committed to) ，即计算 $[A (τ)]_{1}$ : $[A (τ)]_{1} = i = 0 \sum n - 1 A^{(i)} \cdot [τ^{i}]_{1}$

如果我们想省略拉格朗日插值得到 $A (x)$ 这一步，直接使用 evaluation form 去计算 $[A (τ)]_{1}$ 能否做到呢？有一个方法，叫 Lagrange basis polynomials ，可以满足如上需求。

对于 polynomial $A (x)$ over the evaluation domain ${x_{0}, x_{1}, \dots, x_{n - 1}}$
- 定义 $n$ “Lagrange basis polynomials”:
  - For $0 \leq i < n$ :
    - $ℓ_{i} (x) := \prod_{j \neq = i} \frac{x - x _{j}}{x _{i} - x _{j}}$
- 可以写出: $A (x) = \sum_{i = 0}^{n - 1} A (x_{i}) \cdot ℓ_{i} (x)$
  - 特别: $A (τ) = \sum_{i = 0}^{n - 1} A (x_{i}) \cdot ℓ_{i} (τ)$
  - 所以有: $[A (τ)]_{1} = [i = 0 \sum n - 1 A (x_{i}) \cdot ℓ_{i} (τ)]_{1} = i = 0 \sum n - 1 A (x_{i}) \cdot [ℓ_{i} (τ)]_{1}$

FYI : $ℓ_{0} (x) := \frac{x - x _{1}}{x _{0} - x _{1}} \cdot \frac{x - x _{2}}{x _{0} - x _{2}} \cdot \frac{x - x _{3}}{x _{0} - x _{3}} \cdot \dots \cdot \cdot \cdot ℓ_{1} (x) := \frac{x - x _{0}}{x _{1} - x _{0}} \cdot \frac{x - x _{2}}{x _{1} - x _{2}} \cdot \frac{x - x _{3}}{x _{1} - x _{3}} \cdot \dots \cdot \cdot \cdot ℓ_{2} (x) := \frac{x - x _{0}}{x _{2} - x _{0}} \cdot \frac{x - x _{1}}{x _{2} - x _{1}} \cdot \frac{x - x _{3}}{x _{2} - x _{3}} \cdot \dots \cdot \cdot \cdot$ 对于 $A (x)$ : $A (x) = i = 0 \sum n - 1 A (x_{i}) \cdot ℓ_{i} (x) = A (x_{0}) \cdot ℓ_{0} (x) + A (x_{1}) \cdot ℓ_{1} (x) + \dots$

当 $x = x_{1} = ω^{1}$ 时，只有 $ℓ_{1} (x) \neq = 0, ℓ_{1} (x) = \frac{x _{1} - x _{0}}{x _{1} - x _{0}} = 1$ ; $A (x_{1}) = A (x_{1}) \cdot 1$
- 上式的确穿过 $(x_{1}, A (x_{1}))$ 这个 evaluation form 的点
当 $x = x_{2} = ω^{2}$ 时，只有 $ℓ_{1} (x) \neq = 0, ℓ_{2} (x) = \frac{x _{2} - x _{0}}{x _{2} - x _{0}} \cdot .. = 1$ ; $A (x_{2}) = A (x_{2}) \cdot 1$
- 上式也的确穿过 $(x_{2}, A (x_{2}))$ 这个 evaluation form 的点
… 以此类推

在我们的例子中，evaluation domain 是 ${x_{0}, x_{1}, \dots, x_{n - 1}} = {ω^{0}, ω^{1}, \dots, ω^{n - 1}}$ ，所以每一个 basis polynomial 都能被表达为 $ℓ_{i} (x) = \prod_{j \neq = i} \frac{x - ω ^{j}}{ω ^{i} - ω ^{j}}$ , 进一步来说，每个 $[ℓ_{i} (τ)]_{1}$ 都可以被预计算 (precomputed) : $[ℓ_{i} (τ)]_{1} = [j = 0 \sum n - 1 ℓ_{i}^{(j)} \cdot τ^{j}]_{1} = j = 0 \sum n - 1 ℓ_{i}^{(j)} \cdot [τ^{j}]_{1}$ 当 $[ℓ_{i} (τ)]_{1}$ 被预计算 (precomputed) 好之后，committing to A 列只需要在 proof generation 时进行以下计算即可： $[A (τ)]_{1} = i = 0 \sum n - 1 A (ω^{i}) \cdot [ℓ_{i} (τ)]_{1}$ 注意：

每个 $A (ω^{i})$ 都是有限域 $F_{q}$ 的元素
$A (ω^{i})$ 是 trace table 中 column A 的第 $i^{t h}$ 个元素，即第 $ω^{i}$ 行 (从 $ω^{0}, ω^{1}$ … 到 $ω^{i}$ )
每个 $[ℓ_{i} (τ)]_{1}$ 都是椭圆曲线群 $G_{1}$ 上的元素，因此，该计算可以看作标量向量(scalars) 和群元素(group) 向量 之间的点积。 (MSM, great post)

Phase 2 cost summary

commit Trace Table 的每一列 (real and auxiliary cols)
对于长度为 $n$ 的每个列，其 KZG 承诺可以通过大小为 $n$ 的 MSM 计算

Phase 3: Proving the trace table’s correctness

至此，我们已经填写了整个 Trace Table，并 committed 它的每个列（包括 auxiliary cols 辅助列）。

现在剩下要做的就是证明原始 Trace Table 是有效的 (valid)。即意味特定的约束是被满足的，在示例中，我们有以下约束：

Square-Fibonacci 约束
- 每个 selector 启用的行 $i$ 必须满足 $c_{i} = a_{i}^{2} + b_{i}^{2} (mod q)$
线约束 (Wiring constraints)
- 对于 $[a_{i}, b_{i}, c_{i}]$ 和 $[a_{i + 1}, b_{i + 1}, c_{i + 1}]$ 这连续的 2 行，要求 $a_{i + 1} = b_{i}$ 且 $b_{i + 1} = c_{i}$
Public input 约束:
- 第一行必须以前 2 个 Square-Fibonacci 数开始，它们写在公共输入列 (public input column) 的前 2 行中: $a_{0} = p_{0}, b_{0} = p_{1}$
- 第 $n^{t h}$ 个斐波那契平方数对应的单元格必须与声明的结果值匹配，该结果值写入公共输入列的第 3 行: $c_{n - 2} = p_{2}$

通过将每一列，都看作是个多项式的评估形式 (evaluation form, i.e. 把 $a_{i}$ 视为 $A (ω^{i}))$ ，上面提到的约束都可以被看做是多项式之间的某种关系，例如 Square-Fibonacci 约束可以被表达为： $S (x) \cdot (A (x)^{2} + B (x)^{2} - C (x)) = 0, for all x \in {ω^{0}, ω^{1}, \dots, ω^{n - 1}}$ 为方便起见，将左边标记为 $ϕ_{0} (x) := S (x) \cdot (A (x)^{2} + B (x)^{2} - C (x))$ 上面提到的所有约束 (custom gate/wiring/Public input) 都可以被表达为： $ϕ_{i} (x) = 0, for all x \in {ω^{0}, ω^{1}, \dots, ω^{n - 1}}$

Combining constraints

一般来说，当我们有 $m$ 个 constraint polynomials: $ϕ_{0} (x), ϕ_{1} (x), \dots, ϕ_{m - 1} (x)$ 需要在 evaluation domain 上评估为 0 时，它们也完全可以被 batch 起来形成一个约束多项式 —— $ϕ (x)$ ，我们可以通过选择随机数 $γ \in F_{q}$ 来将这 $m$ 个 constraint polynomials: $ϕ_{0} (x), ϕ_{1} (x), \dots, ϕ_{m - 1} (x)$ 通过随机线性组合 (linear combination) batch 起来： $ϕ (x) := γ^{0} \cdot ϕ_{0} (x) + γ^{1} \cdot ϕ_{1} (x) + \dots + γ^{m - 1} \cdot ϕ_{m - 1} (x), x \in {ω^{0}, \dots, ω^{n - 1}}$ 如果所有的约束多项式都满足 $ϕ_{i} (x)$ 在 evaluation domain 上评估为 0，那么显然 $ϕ (x)$ 也在 evaluation domain 上评估为 0；即使有某个约束多项式在某点上评估不为 0，那么 $ϕ (x)$ 也无法满足在 domain 上评估为 0，所以可知 : $constraints satisfied at every row ⟺_{p} ϕ (ω^{i}) = 0 for all 0 \leq i < n$ 如何证明右边这个说法呢？我们可以为每个多项式在每个 evaluation domain 点上都做 reveal 并 Prove ，但是这样会导致极大的 proof size。

事实证明，我们可以仅使用每列多项式的一个评估证明 (evaluation proof) 来证明这样的约束。

The quotient polynomial

如果要证明 meta-constrain $ϕ (x)$ 在 trace table 上每行都成立，这很困难；但好在我们可以推导出一个等价的命题，该命题相对容易证明： $constraints satisfied at every row ⟺_{p} ϕ (ω^{i}) = 0 for all 0 \leq i < n ⟺ (x - ω^{i}) ∣ ϕ (x) for all 0 \leq i < n ⟺ i = 0 \prod n - 1 (x - ω^{i}) ∣ ϕ (x) ⟺ (x^{n} - 1) ∣ ϕ (x) ⟺ \exists Q (x) s.t. ϕ (x) = Q (x) \cdot (x^{n} - 1)$

why $(x - ω^{i}) ∣ ϕ (x) for all 0 \leq i < n$ ?

如果一个多项式在某点为零，这个点是多项式的根，则多项式可以被这个根对应的线性因子整除

所以，如果我们想证明所有约束在每一行上都成立，那么就相当于证明存在一个满足上述性质的多项式 $Q (x)$ ，该多项式通常称为“商多项式(quotient polynomial)”

Computing and committing to the quotient polynomial

虽然商多项式在理论上很容易表达 : $Q (x) := \frac{ϕ ( x )}{x ^{n} - 1} = \frac{γ ^{0} ϕ _{0} ( x ) + γ ^{1} ϕ _{1} ( x ) + \dots + γ ^{m - 1} ϕ _{m - 1} ( x )}{x ^{n} - 1}$

但在实践中计算中，它实际上往往是最复杂且计算成本最高的步骤之一。

首先考虑 $Q (x)$ 的 degree，它的 degree 等于有着最高次数的某个 constraint polynomial ，再减 $n$

在我们的例子中，Square-Fibonacci constraint $ϕ_{0} (x) = S (x) \cdot (A (x)^{2} + B (x)^{2} - C (x))$ 有着最高的 degree $3 n - 3$ ，所以对应的 $Q (x)$ 的 degree 就是 $2 n - 3$ ，为了完全定义这样一个多项式，我们需要至少 $2 n - 2$ 个 evaluation points.

假设 $S (x)$ , $A (x)$ 都是 $n - 1$ 阶的多项式， $A (x)^{2}$ 的阶数为 $2 (n - 1)$

所以 $ϕ_{0} (x)$ 的阶数为 $(n - 1) + 2 (n - 1) = 3 (n - 1)$

因此，我们重新需要大小至少为 $2 n$ 的一系列 evaluation points。之前的 evaluation domain 不 work 了 - 因为 $ω$ 的阶是 $n$ ( ${ω^{i} ∣ i \in N}$ 的大小只有 $n$ )

因此，我们需要选择一些其他元素 $β \in F_{q}$ ，阶数为 $2 n$ 。然后，我们可以在 ${β^{0}, β^{1}, \dots, β^{2 n - 1}}$ 的 evaluation domain 上评估 $Q (x)$ ，以获得我们需要的 $2 n$ 大小的 evaluations

以下是最有效地执行此操作所需的步骤：

对于每列多项式，从 evalution form 转换为 coefficient form.
- 使用 iFFT 可以在 $O (n lo g n)$ 内实现每个变换
对于 coefficient form 的每列多项式，根据我们选择的 ${β^{0}, β^{1}, \dots, β^{2 n - 1}}$ ，生成 $2 n$ 个 evaluations
- 使用 FFT 可以在 $O (2 n lo g 2 n) = O (n lo g n)$ 中实现每个变换
with $2 n$ evaluations of each polynomials，我们现在可以计算 $Q (x)$ 的 $2 n$ 个 evaluations
- 这仅需要根据商多项式的公式进行 field arithmetic 计算

傅立叶变换（Fourier transform）：从系数形式转换到评估形式的过程。简单来说，就是取一个多项式的系数，然后计算这个多项式在一组特定点上的值

逆傅立叶变换（Inverse Fourier transform）：这是相反的过程，即从评估形式转换回系数形式。它涉及到从一组特定点上的多项式值反推出原始多项式的系数

有了 $Q (x)$ 的评估形式 (evalution form)，我们现在可以像计算列多项式一样计算它的承诺：

$[Q (τ)]_{1} = i = 0 \sum 2 n - 1 Q (β^{i}) \cdot [ℓ_{i} ’ (τ)]_{1}$ 注意，由于此时 $Q (x)$ 的 degree 大于列多项式的 degree ，因此我们需要使用更大的 Lagrange basis，虽然可以预计算 (precompute) 这个更大的 Lagrange basis ，并用它来计算 commitment，但它 requires a larger KZG trusted setup - 但 setup 的大小必须 $>$ 商多项式的 degree。

为了解决上面的问题，在实践中用 tricks，让我们只需 commit $d e g ree < n$ 的 $Q (x)$

我们首先使用大小为 $2 n$ 的 iFFT 将 $Q (x)$ 转换为系数形式。
然后，我们将 $Q (x)$ 拆分为两个较小的多项式 $Q_{l o} (x), Q_{hi} (x)$ ，使得 $Q (x) = Q_{l o} (x) + x^{n} \cdot Q_{hi} (x)$
因为每个较小的多项式的 $d e g ree < n$ ，因此每个多项式都可以被 committing to 来用大小为 $n$ 的 MSM

注意，被分解的子多项式的数量取决于商多项式的 degree - 如果商多项式的 degree 为 $3 n$ ，我们需要将其分成 3 个子多项式

Proving the quotient polynomial’s existence

至此，Prover 已 committed 了 trace table 中的所有 column polynomials，并且还 committed 了 quotient polynomial。 Prover 现在需要证明商多项式 $Q (x)$ 确实存在并且计算正确。请记住，如果 $Q (x)$ 存在且成立，则说明所有的约束在每一行上都成立，即 trace table 是 valid

步骤：

选择(Sample) 一个随机数 $α \in F_{q}$
生成并输出所有列多项式和商多项式在点 $α$ 处的的 KZG 评估证明
- 为了生成评估 $A (α) = z$ 的 KZG 证明，我们计算并输出 $[\frac{A ( τ ) - z}{( τ - α )}]_{1}$
- 与 KZG 承诺类似，该值按 MSM 计算
  - 每个列多项式需要大小 $n$ MSM
  - 商多项式需要 2 个大小 $n$ MSM

Verifying the quotient polynomial

verifier 收到 proof 须检查其正确性。一个完整的 proof 包括：

对每列（包括 auxiliary cols 辅助列）和商多项式的承诺 Commitments
每列和商多项式在 $α$ 处的的评估证明 Evaluation proofs

verifier 可按如下方式检查 proofs ：

Verify that each evaluation proof is correct
Verify that the quotient polynomial formula holds at the evaluation point $α$

$Q (α) = \frac{ϕ ( α )}{α ^{n} - 1} = \frac{γ ^{0} ϕ _{0} ( α ) + γ ^{1} ϕ _{1} ( α ) + \dots + γ ^{m - 1} ϕ _{m - 1} ( α )}{α ^{n} - 1}$ 如果上步 2 里的式子在 $α$ 处成立，那么（几乎可以肯定）它在任何地方都成立，因为 $α$ 是随机采样的。

每个 evaluation proof verification 都需要计算椭圆曲线配对 (pairing) 。验证商多项式公式需要一些有限域算术运算（方程右侧）

总之，与 proof generation 阶段所需的计算相比，验证所需的计算是轻量级的，并且通常能够在链上高效地执行。

Phase 3 cost summary

计算 evaluation form 中的商多项式 $Q (x)$
- 通过 $n$ iFFT 将每列多项式转换为系数形式
- 通过 $2 n$ FFT 将每个列多项式转换为 expanded 评估形式 (expanded evaluation form)
- 使用每个列多项式的评估形式，评估 2 2n 个点中每个点的商多项式
致力于商多项式
- 通过大小为 2 2n iFFT 转换为系数形式，以便拆分
- 致力于每个分割多项式，总共需要 2 个大小 $n$ MSM
为随机评估的每个多项式生成评估证明 $α$
- 每个列多项式需要大小 $n$ MSM -（分裂）商多项式需要 2 个大小 $n$ MSM

请注意，“FFT/iFFT”的大小和 MSM 的数量取决于商多项式的次数，而商多项式的次数又取决于最高次数多项式约束。在我们的例子中，最高次数约束的次数为 $\approx 3 n$ ，这导致商多项式的次数为 $\approx 2 n$

Conclusion

Recap

快速回顾一下与 proof generation 相关的 cost :

Phase 1: Filling in the trace table

Filling in witness data requires arithmetic operations over a large finite field
trace table 通常很大，Auxiliary 辅助列需要额外的算术运算和排序

Phase 2: Committing to the trace table

Committing to each column requires a size $n$ MSM

Phase 3: Proving the trace table’s correctness

计算商多项式的 evaluation form 需要 :
- A size $n$ iFFT for each column
- A size $2 n$ FFT for each column
- Arithmetic operations over a large finite field
Committing to the quotient polynomial requires
- A size $2 n$ iFFT to convert to evaluation form
- 2 size $n$ MSMs, one per split polynomial $(Q_{l o} (x), Q_{hi} (x))$
Generating the KZG evaluation proofs requires
- A size $n$ MSM for each column
- 2 size $n$ MSMs for the (split) quotient polynomial

可以清楚地看出，phase-2 和 phase-3 以 MSM、FFT 和 iFFT 等计算量大的算法为主。同样明显的是，所有计算步骤都随着 $n$ 的增加而增加，包括 phase-1 的 witness generation 计算。

Paths toward acceleration

对重计算任务的硬件加速 (Hardware acceleration) 我们已经看到，如 MSM（多项式标量乘法），FFT（快速傅里叶变换），和 iFFT（逆快速傅里叶变换）等重计算在证明生成所需的总计算中占了很大一部分。这些算法在 CPU 上运行通常相当缓慢，可以通过在 GPU，FPGA 或 ASIC 上运行来大大加速。
减少 trace table 中的行数我们还看到，几乎所有涉及证明生成的计算都与 $n$ (即 trace table 行数) 成比例增长（也被称为“门的数量” ）。如何在使用最少行数的同时表示某些复杂计算，是一个具有重大效率影响的研究领域。
Parallelize and pipeline

许多证明系统，包括我们在这里研究的系统，都有自然的并行化机会。例如，在第二阶段的列承诺步骤中，每列的承诺都可以并行计算。更进一步，每个见证列的承诺 MSM 可以与其生成同时并行计算。并行化和流水线化计算可以显著加快整个过程。

Alternative proof systems

本文介绍了一个特定证明系统的计算需求。这个证明系统只是众多系统中的一个 - 在理论证明系统的设计空间中存在很多，每个证明系统都有自己的一套计算需求和权衡。研究正在积极进行以进一步探索这个设计空间，并设计理论构造来减少或消除计算瓶颈。

Take a deeper look at Halo2

对于如下这个 trace table，我们可以定义 Custom gate ： $v b_{1} * v c_{1} + v c_{2} - v c_{3} = 0$ 也可以在其上定义 lookup table，permutation argument 等等… 这些都会转化为具体的 Polynomial cost :

有 3 种类型的 Constraints 我们需要关注：

custome gate
lookup table
permutation

下面我们来看：halo2 后端发生了什么，以及这些 Constraints 将如何影响 Proving time。

lookup table cost

如上是 lookup table 的具体作用步骤：

2 个 columns 排序
Prove for this multi-set check
Prove for the permuted columns, 公式逻辑是：对于 $A^{'}$ 中的每个元素，要么和上一个相等，要么和同 Rotation 处的 $T^{'}$ 相等。

每次添加一个 lookup，几乎相当于添加 4 个 custom gates 甚至更糟。

permutation argument cost

Prover cost

$F (X), σ (X)$ 分别是对 fixed columns 以及 permutation argument 的 commitment，是在电路生成阶段由 key_gen 负责 pre-compute 的，因此不算做 Prover 的工作。

$I (X), A (X)$ 分别是对 Instance column(PI) 和 private value 的 commitment， $m_{I}, m_{A}$ 分别代表 2 个多项式的 degree

从 Verifier 处收到 $β, γ$ random value 后，Prover

为 lookup commit $S^{'} (X), T^{'} (X)$ 和 $Z_{T} (X)$
为 permutation argument commit $Z_{P} (X)$

在 Fiat-Shamir heuristic 中， $β, γ$ 不由 Verifier 生成，而是由 $H a s h (t r an scr i pt)$ 得到

总体最大 cost（粗略估计）

$(m_{I} + m_{A} + 3 d_{T} + d_{p})$ $size-n$ iFFT
$(m_{I} + m_{A} + 3 d_{T} + d_{p})$ $coset$ FFT
$(m_{I} + m_{A} + 3 d_{T} + d_{p} + ρ)$ $size-n$ Multiexp (MSM)
$(2 k d_{T})$ $size-n$ vector “sorting”
$D (d_{G} + d_{T} + d_{P})$ extended vector combination.
Evaluations in polynomial evaluation.

References list

https://scroll.io/blog/proofGeneration
https://drive.google.com/file/d/1Es6SasxViICEQySiDy8vSQvjzZCNcV33/view
https://www.youtube.com/watch?v=3FwoXozVQ9Q
Slides: https://tinyurl.com/4pexkwpe
https://drive.google.com/file/d/1Es6SasxViICEQySiDy8vSQvjzZCNcV33/view

并行 ²: 提高带宽利用率 ³: https://docs.google.com/presentation/d/1e-gmKzFNv4nN-A6rya__Jg_oIUV5U66_9oO_cGQ3Hm4/edit#slide=id.g13bba0f074e_0_5

我们整理分类了 halo2 discord 上面的 Q&A，大部分学习中遇到的问题都可以尝试先在此进行分类搜索

Basics

Q: What’s the actual difference between assign_advice_from_constant and assign_advice in practice?

A: @ying tong

assign_advice_from_constant:

(at keygen) assigns a constant value to a cell in a fixed column;
(at keygen) sets up an equality constraint between the fixed cell and the advice cell;
(at proof gen) assigns that same value to the advice cell.

assign_advice only does step 3).

Q: what’s the difference between PSE Halo2 and original Zcash Halo2?

on a high level: the PSE fork of halo2 supports more features; however, it is worth noting that the zcash/halo2 implementation has been audited. many of the useful features in PSE are pending upstreaming under the nightly flag. here is an incomplete list of the notable differences:

commitment schemes: zcash/halo2 only supports IPA, while PSE additionally supports KZG
lookups: zcash/halo2 only supports fixed tables, while PSE additionally supports dynamic tables
challenge API: PSE supports multiple rounds of commitments and challenges

I think PSE switches use of inner product argument for kzg commitment?

is there an end-to-end example of halo2 proof & onchain verification in Solidity?

https://github.com/privacy-scaling-explorations/snark-verifier/blob/main/snark-verifier/examples/evm-verifier.rs

comparison I am a beginner in Halo2, and I want to create a proof using Halo2 to check whether the user’s age (userAge) is greater than or equal to the target age (targetAge). Does Halo2 support comparison operators? If yes, then how can I define the comparison gate and write the comparison function?

SUNYI:

https://axiom-crypto.github.io/halo2-lib/halo2_base/gates/range/trait.RangeInstructions.html#tymethod.is_less_than
This uses halo2-lib: https://github.com/axiom-crypto/halo2-lib

Could this algorithm be implemented somehow in halo2/plonk? :

#![allow(unused)]
fn main() {
def f(a, b):
    if a == 0:
        return a
    else:
        return b
}

i think you could witness is_zero_a = isZero(a), and use it to constrain the output :

is_zero_a * (output - a) + (1 - is_zero_a) * (output - b)

Daira： how is isZero implemented? to constrain is_zero_a correctly for both cases, you would need to witness alpha = inv0(a) and then constrain is_zero_a * a = 0 and (1 - is_zero_a) * (1 - alpha * a) = 0, as well as boolean-constraining is_zero_a but that may be what isZero does; I’m not sure. I couldn’t find it in halo2_gadgets (IIRC there’s a way to do it in one fewer constraint, but I forget what that was.)

yup, i’ve seen an IsZero like that: https://github.com/privacy-scaling-explorations/zkevm-circuits/blob/6bcb1d052a75886f4a2379347b84fa2bd1ff2bea/zkevm-circuits/src/evm_circuit/util/math_gadget/is_zero.rs

Q: Hey gust! What happens if we reference the previous row in a gate that is active at the 0th row? A: this will “wrap around” to the last row. in halo2, the last few rows of the advice columns are set to random values: https://github.com/zcash/halo2/blob/f9838c127ec9c14f6f323e0cfdc0c1392594d37f/halo2_proofs/src/plonk/prover.rs#L293-L298 i wrote up a minimal example for this (constraint will fail, since the last row has a nonzero random value): https://discord.com/channels/995022112811135148/1154777246188445736/1154843452236910715

Q: Hi, want to make sure, if we dont assign any value to a cell, is it default to 0? Thx! YT: yes, unassigned cells are initialised to 0 in the current implementation; but this is an arbitrary implementation choice, and we shouldn’t rely on it being true. e.g. there was some discussion about randomising unassigned cells: https://github.com/zcash/halo2/issues/614

Q do we need to learn complete rust to build zk-protocol using halo2? A Yes, actually there’s no DSL for Halo2. So the only way to write circuits for it (That I’m aware of) is using the Rust API that the library provides.

I’d not say that you need to be proficient in Rust to write circuits but definitely need to be familiar with the basics of the language.

1. What is the difference between public input and the constant?

A: public input can change between different invocations of the prover, whereas a constant is fixed across all proofs.

In every example I found so far we need to define the add, mul, load_private/constant, expose_public. If those are so popular I suspect they were implemented in some standard library and can be reused?

A: This is what the halo2_gadgets crate is for! It provides a bunch of common gadgets (and chips for them) that can be reused.

If the above is true, does that mean that SimpleExample can be done without implementing a new chip but rather just reusing some other existing code? To me, it seems as if I was trying to learn C++ and someone gave me a hello world that contains operator overloading:)

A: Indeed, it could be. SimpleExample is really providing an example of two things: how to build a circuit, and how to build a custom gadget and chip. It would be useful to split it into two separate examples in the book! I’ve opened an issue for this: https://github.com/zcash/halo2/issues/727

Note however that https://github.com/zcash/halo2/blob/main/halo2_proofs/examples/simple-example.rs cannot be refactored in this way, because it is an example of using halo2_proofs directly; we don’t have access to halo2_gadgets there.

In the circuit, we need to overwrite the configure method. The first argument to that method is the meta argument. What is this argument? It seems like a lot of useful methods are located in this object but I am not sure what is the idea behind and when and where should I use it. As I understand I can access instances of layouter to add new regions for example. But what is the main use case for meta?

A: meta has type ConstraintSystem, and is used inside Circuit::configure to configure the circuit. This is where you tell the backend how many columns (and of what kinds) you are going to use in your circuit, what gates you want loaded, etc.

Chips generally provide a SomeChip::configure method that implements this logic for their needs, which you call inside Circuit::configure if you want to use that chip in your circuit.

I am a little confused between the circuit and execution trace. When we use a plotter to generate colorful images, it seems to me what it represents is an execution trace that the circuit can apply it’s gates to and verify. Could you please clarify what it actually shows so I have the base foundation straight?

A: This is not showing an execution trace, but the actual “physical” layout of your assigned cells in the circuit. The red columns are advice columns; blue columns are fixed columns; and white columns are instance columns / public inputs. Green boxes represent calls to layouter.assign_region, and it’s inside those that the actual cell values are assigned.

I am trying to understand how the chip integrates into the circuit. So in the configure function of the Circuit, we declare all the columns we might need. Then we call the configure function of all the chips that we want to use. Those chips in their configure methods call any configure methods of chips they use. What I notice in the two-chip.rs example is that we only need to define the columns once and then pass them to the appropriate chips. Does that mean that all chips will be reusing the columns defined in the Circuit? Or due to some rust variable borrowing magic, only the chip who’s configure we called last will have access to the columns.

A: Yes, columns can be reused by different chips. As the circuit designer, you get to choose how you “connect up” the chips you are using. You could have all chips use the same few columns, or you could define a bunch of different columns so each chip gets its own set.

I am missing some understanding on how the gates are applied to the execution trace or circuit(not sure of the correct term here). Does every gate gets applied to every row, on columns that are passed into the gate in the column argument? Would be cool to see a visual that would show the values that were loaded in to the regions, on top of the colors, and see how the gates are applied. Does such a tool already exist?

A: Every gate is applied to every row. Think of gates as like Tetris pieces that you hold over every row, and each cell covered by the Tetris piece is used by the gate on that row. This is why we have “selectors” that you can use to enable the effects of a gate only on specific rows.

Re: tooling, this is something I’ve wanted for a long time, but I lack the JavaScript skills to implement it myself.

the difference between copy_advice and assign_advice_from_instance . From the source code I can see that the copy one also adds a constraint that advice must be equal to the instance column, but from Haichen’s talk at 0xPolygon I can see that assign one does that as well. What would be the difference? Also please let me know if I should use the previous threads for additional questions. Thank you! A: The difference is tha copy_advice adds a copy_constraint between two columns at a particular offset also setting the value from one to the other. This, not only assings a witness but also forces the permutation argument to include a copy constraint. The particular difference from assign_advice_from_instance is that copy_advice copies Advice columns while the other copies from Instance columns(so public inputs) into Advice columns.

So in summary:

assign_advice_from_instance -> Copy From Instance -> Advice.
copy_advice -> Copy from Advice -> Advice

Yep. The reason that assign_advice_from_instance exists is that the instance column needs its ordering to be known to the circuit user (so that the verifier can provide the public inputs at the correct locations), and if an instance column gets used in a region it interferes with the floor planner being able to reorder regions for efficiency. So we instead have you copy the public input value from its known instance column location into an advice cell inside a region, and then use it from there.

Q according to you is halo2 better than circom and why? A I think there’s no better or worse. They serve the same purpose but apply different techniques.

While in halo2 you have the power and expressiveness of Rust to help you, you also pay the prize with more verbosity.

Instead with Circom, you don’t have that expressiveness and instead you have concise instructions which are purely the circuit and not rust-only stuff.

Depends on the taste and person. I can’t say that something is categorically better or worse.

Curves

Q: Regarding the generation of Pallas/Vesta or Pluto/Eris, is there some reasons why the parameter b should be the same for both curves in the cycle?

A: Just convenience of implementation It doesn’t constrain the search significantly; you can always find such a b that is the same for both curves. What does constrain it is picking b in advance, which we also did for simplicity.

Q: Is the cell value of Halo2 arithmatization an element of base field or scalar field of the Pallas curve ? Given the cell is the evaluation of polynomial on the root of unity, is it supposed to be an element of the scalar field?

A: currently, proofs from zcash/halo2 are computed on the Vesta curve; so the circuit values are Vesta scalars (i.e. Pallas base field elements).

Q: Ah I see, thanks for explaining, but the ECC gadget is computed on Pallas curve?

A: yes, since it’s working with curve points whose coordinates are in the Pallas base field; in other words, Pallas curve points.

Q: Hello trying out the KZG fork, can I use pasta::Fp in ParamsKZG? Or should I abandon pallas?

A: Pallas and Vesta are not pairing-friendly, so they can’t be used directly with KZG

Hey all.

I’d like to know why https://github.com/zcash/halo2/blob/76b3f892a9d598923bbb5a747701fff44ae4c0ea/halo2_gadgets/src/ecc/chip.rs#L140 is forced to use pallas::Base ，when if made generics, this could serve as a chip for any elliptic curve with the same properties.

I’ve seen https://github.com/zcash/halo2/blob/main/halo2_gadgets/src/ecc.rs#LL40C1-L43C59 but I doubt that this is a blocker actually. You can have a trait that actually has these constants as functions instead and they return a constant result always.

I’d appreciate if you could explain if there’s any other limitation aside from the second link I sent. As on that way, I might give a shot to the actual task of removing the generics.

Daira: I think I never actually confirmed the assertion that p and q can be swapped safely in that implementation, or what exactly it depends on. The security analysis was done only for Pallas.

For the Orchard circuit, the proof system is over Vesta and the curve multiplication is over Pallas. The scalar is given as a Pallas base field element, which is smaller than Pallas’ scalar field. If it were the other way around, the scalar could overflow, and the consequences of that are what haven’t been analysed.

Thanks @Daira Emma (ze/hir) — ECC ! My question wasn’t targeting Vesta specifically. Rather, targeting the possible implementation of Pluto-Eris with the ECC chip. Or in general, allow any Weierstrass curve to use this chip.

Hence, on that line of thought I was asking if it would be a big issue to just try to remove the issue introduced by FixedPoints so that we can have a trait instead of a fixed type (pallas::Base ) in this case. or, instead, there are still hidden issues if we try to impl other curves.

Also, is it possible that by removing some optimizations, we can make the ECCChip able to swap curves? Or is it that by design, one chip serves for only one curve?

There are still hidden issues, but it can be generalised with a bit of work (and that’s on our roadmap since it’s needed for recursion) As you say, some optimizations would need to be removed, because the current implementation depends on the fact that p and q have bit pattern "1 <many zeroes> ..."

the short answer is that we originally made it generic, but didn’t have the engineering bandwidth at the time to ensure that the implementation was actually safe generically, so we specialised it to reduce reviewer burden.

materials

Q: Hi there, I am exploring Halo2 project and have checked out the Halo2 book and lectures offered by 0xParc. But I still can’t find a formal documentation like rustdoc for the helo2 core library even for early edition. Is there anything like that, or how can I have a more complete view on the functionalities that core components provide? (Like Chip, Config, Circuit, MockProver, Layouter etcs). Any informal material can be a great help!

A: There are links to doc on crates.io pages

https://crates.io/crates/halo2_proofs https://docs.rs/halo2_proofs/0.2.0/halo2_proofs/

https://crates.io/crates/halo2_gadgets https://docs.rs/halo2_gadgets/0.2.0/halo2_gadgets/

And I guess cargo doc –open being run on source code will give you docs on exact commits if you need other version than 0.2.0

recursion material to halo2_proofs

Q: is recursion material to halo2_proofs? or is plonkish arithmetization > ipa something that happens without any recursion?

A： The latter. Halo 2’s recursion capabilities (once implemented) will be built on top. The Halo 2 protocol is designed with awareness of, and intention to support, recursion. But that just affects how the base protocol works; it doesn’t necessitate recursion in order to use it.

Q: good to know - doing a writeup on battleships and wanted to make sure I frame things right

A : Halo 2 as a protocol is effectively a synthesis of Plonkish arithmetization, and a polynomial commitment scheme that is amenable to the Halo recursion technique. (And also a bunch of other things that make the overall proving system more efficient, and API designs for making it possible to build fast and safe circuits, etc.)

gadgets

Poseidon

we’re struggling to hash a variable-length input using the default Poseidon implementation from halo2. since the library only implements the ConstantLength Domain, I assume that we need a different implementation for the VariableLength. Could anyone point us to a project that’s doing that, or guide us on how to implement that?

YT: it looks like the axiom fork does variable-length Poseidon (https://github.com/axiom-crypto/halo2/tree/main/primitives/poseidon):

idk how this interacts with Poseidon standardisation efforts, @str4d - ECC might have a better idea: https://github.com/C2SP/C2SP/pull/3

there isn’t a restriction on L to be a multiple of RATE, because we pad the input to a multiple of RATE: https://github.com/zcash/halo2/blob/main/halo2_gadgets/src/poseidon/primitives.rs#L319-L327. however, there is a bug in the loading of the padding words, which should be fixed by this PR: https://github.com/zcash/halo2/pull/646 (i’m going to bump this PR for re-review, i don’t recall why we didn’t merge it the last time)

Q: Hi team, I wonder whether there is any reference/example on how to use Poseidon gadget of Halo2? I’m rather in engineer background and don’t know the very detail of Poseidon hash function. I just find it extremely painful to use this gadget https://docs.rs/halo2_gadgets/latest/halo2_gadgets/poseidon/struct.Pow5Chip.html

Some specific questions are: (1) What are the meaning of WIDTH/RATE parameter and how I should choose them? (2) What are the usage of state/rc_a/rc_b/partial_sbox column and can I reuse them for other parts of my circuits? (3) How can I assign cells for the Pow5Chip (through Hash::hash?)? (4) Which library is recommended to calculate the ground truth for hash result, as they all have different setups (field, parameter….)? (e.g. https://github.com/ingonyama-zk/poseidon-hash)

While I’ve used Poseidon in Circom which is just one line work like “component message = Poseidon(2)”

A by himself: For the above question, I just find it a great illustration in test cases of the library ! 😀

https://github.com/zcash/halo2/blob/main/halo2_gadgets/src/poseidon/pow5.rs#L811

padding

Hello, everyone. If I want to implement the padding in zkp circuit using halo2, how can I do that? For example, I would like to implement the padding of md4 hash function. It includes padding the extra bytes to the end of original message.(Assuming that message is byte array - Vec<u8>) (Seems silly question, but would like to know how to do it if possible)

I think SHA256, Poseidon, and Sinsemilla might be good reference implementations. (https://github.com/zcash/halo2/search?q=padding). https://github.com/zcash/halo2/blob/a19ce33c395eb14f951e4d64d1bd3c7d6f714366/halo2_gadgets/src/sha256.rs#L137-L140 looks like the entrypoint for padding in the sha256 gadget

keccak256

Q: hey, is there any demo about how to expose the keccak256 hash result as instances in the halo2 circuit using the BN256 curves? the keccak256 hash result can be convert to be an Uint256 type data, but the BN256 data is about less than Uint254 A: the zkevm-circuits impl witnesses the Keccak output hash as 32 bytes (each of them range-constrained): https://github.com/privacy-scaling-explorations/zkevm-circuits/blob/main/zkevm-circuits/src/keccak_circuit.rs#L524-L531

XOR

Q: I’m just writing a simple XOR chip for understanding lookup table API, have few q:

Is it okay for witness to contain plain u64 types (not field)? (https://github.com/zemse/halo2-playground/blob/main/src/chips/xor.rs#L129-L130)
Usually output from chips is an AssignedCell (e.g. mul chip https://github.com/zemse/halo2-playground/blob/f7d58ed14caf114a7d3562ff68c6aa3ccf017e0c/examples/simple_example.rs#L265). Is it possible to calculate XOR by converting the AssignedCell into u64? (to do this: https://github.com/zemse/halo2-playground/blob/f7d58ed14caf114a7d3562ff68c6aa3ccf017e0c/src/chips/xor.rs#L92)
Instead of calculate_xor, would it make more sense to pass the result of XOR operation in the witness and then check if it is correct (and use result cell further wherever necessary)?

I see the lookup tables section in the docs is marked TODO so would it be fine if I try to make a PR with the XOR chip as an example? https://zcash.github.io/halo2/user/lookup-tables.html

A: plain u64 types ：Yes, but you will need to implement range constraints somewhere to ensure they are only 64 bits. I see that you separately have a BITS const generic, so really that is what you want to range constrain to (and then somewhere else you should constrain that BITS <= 64).

Is it possible to calculate XOR by converting the AssignedCell into u64?

The way you need to do this is to take the AssignedCell s where left and right have been assigned (most likely by taking them as gadget inputs and then copying them into cells inside the local region), and use .value() to get the Value s assigned into left and right. Then you can compute the XOR as:

#![allow(unused)]
fn main() {
let result_val = left.zip(right).map(|(left, right)| left ^ right);
}

and assign that into the result cell.

zk-ecdsa in halo2?

Axiom has an implementation of that available https://github.com/axiom-crypto/halo2-lib/blob/main/halo2-ecc/src/secp256k1/tests/ecdsa.rs

MiMC

https://github.com/avras/mimc-halo2

waiting fix：

Happy Monday everyone! I am visualizing the circuit and tried filling the circuit for proving that I know x that satisfies x^3+x+5=35. 3 is private input, 5 is a constant and 35 is the public input. I had a few questions where things did not really align for me:

What is the very first row that is not labeled? I get it in every circuit I visualize.
Why loading constants takes two columns? All I do is I assign_advice_from_constant.
To use the constant cell or instance cell in the computations I first need to load it into advice columns? Essentially I am wondering if the load_constant step can be skipped?
Nothing in the instance column (first white column) is greyed out. Does that mean I have loaded 35 as public input incorrectly?
Selectors get enabled for the entire height of the region? Trying to understand why mul and add have height of 2 rows and not just one row in the selector columns. Looking at the number table I filled that should not work and 1 should only be set for one row in the region.

Just in case here is the code for the circuit:https://github.com/0xTaiga/SimpleCircuit/blob/main/src/main.rs

serialization/deserialization

Hi everyone! I am working on a serialization/deserialization method to write and read Halo2 circuits and proofs. For instance, when I need to reed and write circuit parameters I can use read and write functions in the impl of the Params public structure and it works well.

My issues start when I try to move forward to the proving and verification keys. I have tried to implement bincode::Encode on a struct that mirrors the ProvingKey struct, but I struggle with the fields of ProvingKey being private. I also came across other things being private that prevent me to write a bincode::Encode implementation outside the halo2 crate, for instance the Module permutation. Are you people aware of a better way to serialize and deserialize Proving and Verifying keys, or I have no choice but to fork the halo2 repo? I would rather not do that. Thanks a lot in advance

Define a stable serialization format for halo2::plonk::ProvingKey https://github.com/zcash/halo2/issues/443

A: Because Halo 2 doesn’t have a trusted setup (and the generators are computed by deterministically hashing to the curve), the only thing necessary to reproduce the proving key is the code of the circuit. Since that’s necessary for proving anyway, I don’t think there’s an advantage to reading and writing proving keys from/to disk. The same argument would not apply to verification: you can verify a proof with just the verifying key, without needing the code for the circuit.

In proving systems like Groth16, it was necessary to read the proving key from disk because there was information stored within it that we couldn’t derive on-the-fly. For Halo 2, reading the proving key from disk would solely be a potential performance optimisation, if it takes less time to read the proving key from disk than to re-compute it.

I recently added key generation benchmarks to benches/plonk.rs, and for its particular circuit structure, I see the following times on a Ryzen 9 5950X:

Q: Hey! I was wondering, what is the intended way of (de)serializing the verifying key struct? If I understand correctly, assuming the verifier is different from the prover, the prover would need to pass the vk along with the proof, presumably over the network?

A: this is still WIP on zcash/halo2 right now: https://github.com/zcash/halo2/issues/643 but there’s a PR for it that is already being used in some other forks: https://github.com/zcash/halo2/pull/661

wait to be organized

arithmetisation

Q: Can a row be described as a step of computation in the sense a computation is flatten into many steps(rows) and cells are the computation trace? without using the math description behind it, i.e. nth root of unity

YT： i think this is the model used by AIR arithmetisation, where a single relation is uniformly checked on each row.

the PlonK arithmetisation allows us to express less uniform relations, e.g. it could be that a relation only applies on some rows; or is irregularly “shaped” and only applies to part of a row; or spans multiple rows; etc.

A： You are right, thanks for pointing out, so each step of computation can be represented by any shape (region) in the Plonkish matrix? There is no significant meaning of a single row except it is nth root of unity?

str4d - ECC： Indeed. It’s easier to think of the rows and columns as “area” that can be filled by the initial, intermediate, and final values within the computation, similar to laying out a circuit board or computer chip.

So e.g. you could have “steps go sideways” by having your constraints mainly reference cells in a single column, but have the overlapping references go into adjacent columns. It would definitely be unusual (because the root of unity logic means the constraint applies to all rows, not all columns, so you don’t get automatic tesselation), but it might make sense for some kinds of circuits (e.g. I could imagine representing some kind of layered neural network structure where you want to apply the same constraint to a bunch of adjacent cells that feed into overlapping “outputs” in the next layer, that you could maybe represent in this way).

More usually, you define some small regions in which you have a small sequence of computation (so inside that region, you could likely consider each row of the region to be a “step”), but those regions can be positioned arbitrarily within the overall circuit area (so the “circuit rows” don’t correspond to overall computational steps, unlike AIR).

lookup table、lookup system/SHA256

Since using lookup we can ensure if a tuple of witness values exist in a lookup table. however is it possible to constrain that a tuple of witness values do not appear at all in the lookup table?

Q: Is anyone working on more efficient lookup arguments in Halo2, like Caulk+ or cq? Decoupling proving time from the table sizes would be 🔥

YT: a colleague and i have been working on:

MVLookup (PSE fork): https://github.com/geometryresearch/halo2/pull/1
cq (Axiom fork) https://github.com/geometryresearch/halo2-cq/pull/1 still very WIP, but it seems promising from initial benchmarks!

dynamic table:

https://github.com/zcash/halo2/pull/715
WIP ?

Q: Are there any instructions on creating a dynamic lookup table for prover-time variables?

A: if you are on the PSE fork, there is the lookup_any API: https://github.com/privacy-scaling-explorations/halo2/blob/main/halo2_proofs/src/plonk/circuit.rs#L1725-L1749

Q: Hello, halo2-ers, I’m a newbie in the Halo2 zkp system, I have been confused about the lookup system, when we construct the lookup for the zk unfriendly operations like sha256/keccak256, how do we confirm the validity of the ops lookup table that have built?

A lookup argument simply checks that a value is inside of a table. Indeed, the real lookup argument checks that one set of arguments is a subset or a permutation of another one.

So for instance, you might want to:

Have a circuit/gate that executes the Hash (provided a set of inputs) and returns the output.
Make this circuit expose this relation Input - Output in a lookup table.

Then all users can lookup this table with input-output with the guarantee that each relation has been constrained already. So to make it easy, you just need to compute the hash once, and then you can look it-up N times 🙂 The issue normally is that the inputs of the hash do not fit inside of a column and then you need sophisticated designs to sort this out.

You can also use Chips like the SHA256 in halo2_gadgets for example which are already build and just require to put the things inside tables.

Q: Hello, I would like to ask question about lookup & table column. Why the table column cannot be re-used as ordinary fixed column? I found that the table column is, in essence, fixed column, wrapped inside TableColumn struct. Also, I would like to know the detail of permutation used in lookup argument.(I read that it is different from that of plonk).

A: currently, halo2 fills in TableColumns with a specified default value, which is why we cannot used an ordinary Fixed column as a TableColumn. but i actually don’t see what’s stopping us from using a TableColumn as an ordinary Fixed column.

it is true that both the permutation and lookup arguments internally make use of some variant of multiset equality. however, the permutation argument does so on tagged cells, thus enforcing a specific permutation.

whereas the lookup argument does so on untagged cells, thus allowing any permutation. (note that the complete lookup argument involves additional checks besides this multiset equality check.)

str4d: The problem is that whatever goes into a TableColumn needs to be valid for the table lookup, because technically the entire column is in the table due to how the lookup argument is constructed, regardless of how many rows the real table has.

Dynamic lookup tables fix this with the tag column, which restricts the range of rows over which a lookup will constrain a table, thus freeing up the rest of the column’s rows for other things.

So you pay the cost of one or more separate fixed columns for the tags, but in exchange get to split up the table columns by row.

Some more questions:

Currently, the dynamic lookup table idea is implemented in halo2?
If so, can you give me reference or example code?
In case of dynamic lookup table, it looks like I can re-use other rows of table column as one of ordinary fixed column. right?

The implementation is in https://github.com/zcash/halo2/pull/715, which we are working to get merged as a nightly (and therefore unstable) feature (https://zcash.github.io/halo2/dev/features.html).

Selector optimism

Q: Is the layouter automatically optimizing for selectors? From the printing of the circuit, it seems that the number of selectors added to the circuit is equal to the max number of selectors that are enabled at the same time. For example, if the circuit config contains 10 different selectors, but at max 2 of them are enabled together in a region, the circuit wll only have 2 selectors. Is that correct? A: yes, the layouter combines mutually exclusive selectors into fewer fixed columns. however, it only does so up to the maximum degree bound. there’s a write-up of this optimisation at https://zcash.github.io/halo2/design/implementation/selector-combining.html

copy instance col

Q: Hi all, quick question. how would one copy a variable length instance into an advice column? My tmp solution is to keep calling assign_advice_from_instance until I get an Err, but is this the idiomatic way?

A: An instance value cannot truly be variable length: you eventually run out of circuit rows to fit it in. Generally in this kind of case, what you need to do is have a hard-coded maximum length, and always copy that in, and then have logic inside the circuit to handle the variable length.

Note however that the circuit needs to always perform logic on the full maximum length of the instance value (circuits always encode “worst-case performance”), so you need some way of performing “dummy” operations on the instance value.

Alternatively, if you don’t mind different-length instance values using different circuits (which from a privacy perspective is fine because the instance values are by definition known to the verifier), then add a const generic length parameter to your circuit. Then within that circuit you can treat the instance value as a fixed length.

Ah I see! Thanks for such a detailed explanation.

cost

cost model for IPA: https://github.com/zcash/halo2/blob/main/halo2_proofs/src/dev/cost.rs

this cost.rs file looks potentially quite useful: https://github.com/zcash/halo2/blob/main/halo2_proofs/src/dev/cost.rs but there’s no documentation i can find; how do i use this with my circuit? is it built in somehow? or do i manually fill all of the values?

You call CircuitCost::measure(K, your_circuit) where your_circuit is an instance of your struct that implements Circuit

cool, this worked:

#![allow(unused)]
fn main() {
println!(
    "{:?}",
    CircuitCost::<Eq, MyCircuit<Fp>>::measure(
        (k as u128).try_into().unwrap(),
        &circuit
    )
);
}

there was a smol bug with lacking permutation checks that I’ve posted about here: https://github.com/zcash/halo2/issues/748

Q: why rotation is costly in halo2?

A: I wouldn’t say it’s excessively costly. But use of rotations does increase the number of commitments in the proof (see https://github.com/zcash/halo2/blob/main/halo2_proofs/src/dev/cost.rs for the details)

folding/recursion

Has anybody implemented the Folding scheme for Halo2 lookups? I am curious how efficient it’s going to be. Thanks. @yisun https://hackmd.io/@aardvark/rkHqa3NZ2

There is an implementation of Sangria here which I believe also incorporates some form of lookups: https://github.com/han0110/plonkish/tree/feature/sangria

Q: Maybe this should be asked in ⁠recursion channel, but anyway I’m asking here. I didn’t read full paper so please tell me a chapter if it’s written in full paper. I watched video materials and some online resources about recursive nature of plonk circuit. I understand that halo2 works if you can put verification circuit of plonk inside its own circuit, but I’m not exactly sure how this can be achieved. If you first prepare a circuit which is target of verification, then wouldn’t that change the verification logic itself? Are there any proof-of-concept implementation for this chicken-and-egg circuit recursion problem?

A: one solution i’ve seen is for the recursive verifier to take in a verifying key as input, along with the prior proof. this is how it’s done in arkworks-rs/pcd:

recursive verifier that takes a help_vk as input: https://github.com/arkworks-rs/pcd/blob/master/src/ec_cycle_pcd/data_structures.rs#L85-L100
where help_vk is used to verify prior proofs: https://github.com/arkworks-rs/pcd/blob/master/src/ec_cycle_pcd/data_structures.rs#L296-L301
chain of recursive proofs in a test: https://github.com/arkworks-rs/pcd/blob/master/tests/mnt4_marlin.rs#L142-L165

in an accumulation scheme, the accumulation verifier does not fully check the prior proofs, but rather checks that they have been combined correctly into the accumulator. e.g. in Nova:

we fold two previous instances into a new one (https://github.com/microsoft/Nova/blob/main/src/circuit.rs#L285-L297)
recursive minroot example (https://github.com/microsoft/Nova/blob/main/examples/minroot.rs#L223-L241)

I’m new to Halo2 and the reason I’m learning it is to use recursive proof/verification. However, I see it’s still marked as “coming soon” on the website. Is there any estimates of when it will be available? Is there a beta version that we can start learning and experimenting now? Thank you in advance,

No response

Mockprover

I’m trying to understand what does mock prover do internally? does MockProver::run run keygen-and-prove operation on the given circuit as the comment of the function claims? I couldn’t find where is the keygen called inside the run function

YT： keygen_pk() collects fixed information about the circuit structure and encodes it in the ProvingKey. this is done using just the constraint system, without an actual witness. at proving time, the prover inputs this ProvingKey and their witness to create_proof(). MockProver::run() combines the two steps by collecting information about the circuit structure + assigning the witness to this structure “in the clear”. this lets us sanity-check an assignment without doing the expensive FFTs and commitments involved in the real proving/verifying process.

I see thank you for the clarification, I thought it would call keygen_pk() explicitly but I realized it’s not necessary as you explained

keys generation

Q Is it possible to compile the halo2 binary and during runtime have it generate a circuit/proving/verification keys? (the circuit is not known at compile time) Something similar to what is possible with circom/snarkjs, where we feed a high-level circuit description to the circom binary, it generates the .r1cs file and we feed the .r1cs to snarkjs for proof/verification.

A @dan not at present, but it’s something we do want to enable in the near term. https://github.com/zcash/halo2/issues/550 is the issue tracking this.

Hi I am trying to build prover and verifier as separate rust binaries and currently facing a problem with keys generation. What is the recommended way of passing proving and verifying keys to separate binaries? I was thinking of generating them in build.rs and serializing to text files to deserialize them later while building binaries, but the structs don’t seem to support serialization out of the box

A: There is currently no way to serialize proving or verifying keys, due to limitations in how the internal types are structured. The tracking issues for this are https://github.com/zcash/halo2/issues/443 and https://github.com/zcash/halo2/issues/449.

What is the reason for create_proof and verify_proof to use params as an argument? As far as I understand, a constructed params instance is a toxic waste as it exposes a random generator used for vk and pk creation and therefore shouldn’t be shared publicly. But if I want to run prover and verifier independently (on different machines, for example) I am supposed to share a constructed params instance therefore compromising random generators used for keys generation. Which gives a malicious party the ability to reconstruct the keys and create malicious prover/verifier. Is there something I am missing on this?

str4d: params is not toxic waste. It is deterministically generated and can be reproduced by anyone who knows the circuit structure (which the verifiers need to know). params is just common data that both the prover and the verifier need. It could equivalently be considered “part of the verifying key”.

YT： the params contain only public information:

zcash/halo2 does not use a trusted setup. Params contains a vector of random curve points g: Vec<C>, which are not secret values. rather, they are generated in a transparent way using public information: https://github.com/zcash/halo2/blob/main/halo2_proofs/src/poly/commitment.rs#L47-L62
there is a fork of halo2 that replaces the IPA commitment scheme with KZG. this indeed requires a trusted setup; however, the resulting Params does not contain the secrets used in the setup. instead, it contains only publicly known commitments to them. to find out more about the KZG trusted setup: https://vitalik.ca/general/2022/03/14/trustedsetup.html

A: Yeah, it looks like I was mislead by the KZG params description from pse fork sources and decided that the same goes for IPA as well. Thank you guys a lot for the explanation, that is really helpful. So if I want to use KZG scheme (which allows params, vk and pk serialization), I have to use trusted setup, and if I wish to avoid trusted setup I have to use IPA scheme, which currently doesn’t support serialization (as far as I saw in GitHub issues)? Maybe there is a way to have both trustless setup and the ability to share keys between different machines, that you are aware of?

zcash/halo2 will eventually support serialization, it just requires a bunch of refactoring work first we haven’t had time for But in the meantime, you can share keys between different machines, by running the same keygen on each of the machines. The keys aren’t “random”, they are deterministic This is precisely what we do currently with zcash/halo2 in its use in Zcash. Every machine has the code for the circuit, so they just run keygen once on startup and then keep the keys in memory.

So if I run i.e. let params = Params::new(4); let vk = keygen_vk(params, &empty_circuit); let pk = keygen_pk(params, vk, &empty_circuit); on 2 different machines (prover and verifier) with the same circuit code, the proof generated by prover will be verifiable by the verifier? Or does it require some more tinkering with keygen parameters? Sorry if my questions may seem pretty basic, I am still new to halo2 and mostly think based on experience with trusted setup SNARKs

As long as the inputs to the keygen functions are the same, the outputs will be as well. So yes, you need to use the same k value for Params, the same Circuit type, for both keygen_vk and keygen_pk, and the same empty_circuit instantiation (using Value::unknown() for all witnesses, but anything else that is not a Value witness needs to be the same, in order for the circuits to have the same structure).

layout / Layouter

Q: what is the point of the layouter having different namespaces? does it actually mean anything/separate anything or is it just for debugging

A: It’s purely for debugging. The namespaces are implemented via closures specifically so that in normal prover or verifier usage, they have zero cost (as the closures are never evaluated).

Q: I am not familiar with the rules for circuit layout. , I am unsure about the rules for arranging the rows of the circuit. Can the rows be laid out arbitrarily, or are there specific guidelines to follow ?

A: one important rule is that: cells queried in a custom gate MUST be assigned in the same Region. this is because the Layouter can move Regions around for optimal packing; so we cannot assume that offsets between different Regions will be preserved.

for example:

a mul constraint that queries the out cell at Rotation::next: https://github.com/zcash/halo2/blob/main/halo2_proofs/examples/simple-example.rs#L89-L117

#![allow(unused)]
fn main() {
// Define our multiplication gate!
meta.create_gate("mul", |meta| {
	//
	// | a0  | a1  | s_mul |
	// |-----|-----|-------|
	// | lhs | rhs | s_mul |
	// | out |     |       |
	//
	let lhs = meta.query_advice(advice[0], Rotation::cur());
	let rhs = meta.query_advice(advice[1], Rotation::cur());
	let out = meta.query_advice(advice[0], Rotation::next());
	let s_mul = meta.query_selector(s_mul);

	vec![s_mul * (lhs * rhs - out)]
}

this out cell is assigned at offset 1, in the same region as the lhs, rhs cells at offset 0: https://github.com/zcash/halo2/blob/main/halo2_proofs/examples/simple-example.rs#L212-L216

#![allow(unused)]
fn main() {
fn mul(){
	// Finally, we do the assignment to the output, returning a
	// variable to be used in another part of the circuit.
	region
		.assign_advice(|| "lhs * rhs", config.advice[0], 1, || value)
		.map(Number)
}
}

Runtime circuit configuration

https://docs.rs/halo2_proofs/0.2.0/halo2_proofs/plonk/trait.Circuit.html#tymethod.configure

This method does not have a &self parameter, so configuration must be independent of the concrete value of the type I implement Circuit for. Does it mean that the number of columns that I allocate for my Circuit must be constant? I.e. I can’t have a: MyCircuit and b: MyCircuit use different numbers of advice columns? Is there a way to allocate different number of advice columns (determined at runtime)? Or is it not allowed by design?

A: Indeed, currently the number of columns is fixed. This is for various reasons including simplicity of the original implementation, but it is a limitation we want to remove: https://github.com/zcash/halo2/issues/195

Allowing circuits to be fully defined at runtime would also enable us to support IRs (and thus compile circuits from other languages): https://github.com/zcash/halo2/issues/550

without_witnesses()

What is the purpose of without_witnesses method here? Is it to strip the Circuit of any prover-private information, so it can be safely sent/published somewhere? (It wasn’t clear for me from the comment, because it answers the question of how and not the question of what.)

https://github.com/zcash/halo2/blob/642924d614305d882cc122739c59144109f4bd3f/halo2_proofs/src/plonk/circuit.rs#L475

A: circuit.without_witnesses() has to maintain the “shape” of circuit, that is, the structural parameters that determine the set of columns, the placement of regions and gates etc. https://github.com/zcash/halo2/issues/613

This is primarily because the layouter might need multiple passes, some of which do not compute witnesses. Usually, it’s that it would be unnecessary and inefficient to compute them on every pass, not that it would be incorrect or insecure.

synthesize()

Q: Is Circuit::synthesize() context aware? Specifically, does it know if it’s the process of proving/verifying or key generation? If so, is this accessible from the function?

A: no, but FloorPlanner::synthesize() may be able to see the CS: Assignment bound it’s using:

in keygen, this ignores advice values: https://github.com/zcash/halo2/blob/main/halo2_proofs/src/plonk/keygen.rs#L107
in prover, this only cares about advice values: https://github.com/zcash/halo2/blob/main/halo2_proofs/src/plonk/prover.rs#L191-L215

copy_advice()

value.0.copy_advice(|| format!(“output[{}]”, i), &mut region, config.advice[2], i)?;

does this line copies the value into the 3rd advice cloumn ith row?

yes! (note: it copies to offset i in the region, which may have a different absolute row after the floorplanner passes.)

did you mean the values to be inserted may shift?

yes, even though the value is assigned at offset i in the region, the region itself may be moved elsewhere in the circuit.

We will partition a circuit into regions, where each region contains a disjoint subset of cells, and relative references only ever point within a region. Part of the responsibility of a chip implementation is to ensure that gates that make offset references are laid out in the correct positions in a region.

Given the set of regions and their shapes, we will use a separate floor planner to decide where (i.e. at what starting row) each region is placed. There is a default floor planner that implements a very general algorithm, but you can write your own floor planner if you need to.

(from https://zcash.github.io/halo2/concepts/chips.html#chips)

we definitely need better documentation. if you have any questions that you would like the book to address, please do open an issue.

64 bit field elements / `Value<F>`

I need to use 64 bit field elements to call a function in a custom gate. I’m currently winging it by using “Value<F>,” is there a better way to represent a u64 in a field?

YT: to range-constrain the field element to 64 bits, you may consider breaking it into (say) bytes and looking these up in a precomputed table of values 0..=255.

something like this is done in the ECC gadget: https://github.com/zcash/halo2/blob/main/halo2_gadgets/src/ecc/chip/mul_fixed/short.rs#L79-L106

Daira: As well as that, consider using AssignedCell<u64, F> to keep track of the type in the Rust code (note that this doesn’t by itself enforce the range constraint): https://github.com/zcash/halo2/blob/main/halo2_proofs/src/circuit.rs#L95-L164

I see, so , in

#![allow(unused)]
fn main() {
pub fn value(&self) -> Value<&V> {
	self.value.as_ref()
}
}

Is value returning a reference to a 64 bit max value or just the type?

YT: value() returns a Value<&u64> which is a wrapper around an Option<&u64>.

however, this u64 type is only enforced by the Rust type system, and NOT by the circuit constraints. to range-constrain it in the circuit, you can use e.g. a lookup table.

circuit layout

I am attempting to optimise the simple example from the halo2 examples (c = a**2 * b**2). I have removed the fixed column for loading constant and instead loaded it into advice column. Also combined the two advice columns into one. I have tried the same and seems to work (verification success and failure expectation). The circuit layout previously was using: 9 rows x 5 columns = 45 cells and after doing the above it is using: 12 rows x 3 columns = 36 cells. My questions: Since the cells used appear to be less, does this optimisation make sense? (even though a constant is assigned in advice instead of fixed column) I also see additional detail called “10 usable columns” and “26 usable columns”, what does it mean and does it contribute to the prover cost? Below is circuit layout before and after

YT: (nice diagrams!)

assigning the constant to an advice column changes the circuit’s intended behaviour. we no longer have the guarantee that the final c = constant * absq is a multiple of the desired constant, since the prover could have witnessed any arbitrary factor in its place.
for your provided k = 4, you get n = 2^4 = 16 rows, the last few of which are “poisoned” (unusable). to see how and why these rows are poisoned: https://github.com/zcash/halo2/blob/main/halo2_proofs/src/plonk/circuit.rs#L1433-L1460
the prover cost is largely dominated by the size of n. roughly speaking, there is a tradeoff between no. of rows and no. of columns: for the same area, a shorter/wider circuit has a faster prover/larger proof; and a longer/narrower circuit would have a slower prover/smaller proof.

constant in halo2

Q: Hi! I’am a little confused about constant in halo2? It seems that you don’t need to copy from a fixed column to constraint a cell to a constant in halo2? see my issue for more details: https://github.com/zcash/halo2/issues/766. Looking for your reply. Thanks!

A: the constant value will be assigned to a cell within one of the fixed columns configured via ConstraintSystem::enable_constant.

so behind the scenes, the assign_advice_from_constant API still creates a copy constraint between a fixed cell and an advice cell.

Q: Thank you for your reply.But i still confused because ROUND_CONSTANTS in the code is not a fixed column.It’s just a [u32; 64]. See: https://github.com/zcash/halo2/blob/2bdb369393c11dfd093d68f9253e8f12e9e6281a/halo2_gadgets/src/sha256/table16.rs#L26-L36

My question could turn into: why CompressionConfig in sha256 gadgets doesn’t need a Column<Fixed> ? 😫 https://github.com/zcash/halo2/blob/2bdb369393c11dfd093d68f9253e8f12e9e6281a/halo2_gadgets/src/sha256/table16/compression.rs#L433-L454

YT: i think you found a bug in the experimental sha256 gadget! ROUND_CONSTANTS should definitely be copied from a fixed column.

e.g. this is how Poseidon initialises the rate and capacity elements: https://github.com/zcash/halo2/blob/main/halo2_gadgets/src/poseidon/pow5.rs#L291

a pull request fixing this would be greatly appreciated!

gas cost/onchain Verifier/solidity

hi, what’s the actual relation between the halo2(kzg) circuits’ scale and the zkp verification gas cost? I use the snark-verifier: https://github.com/privacy-scaling-explorations/snark-verifier to generate the solidity verifier, it seems to be more gas consumption as my circuit scale gets lager

YT： i’m not familiar with the snark-verifier, but i would guess that costs relate to this CostEstimation: https://github.com/privacy-scaling-explorations/snark-verifier/blob/main/snark-verifier/src/verifier/plonk.rs#L171-L188

CPerezz： In recursion verification circuits for KZG, the more Advice columns and the larger they are, the more you pay at proving time.

As for the solidity verifier, it should scale only with respect to the amount of columns used.

Han： yeah the gas cost would scale mostly with the amount of columns used, see this for more accurate estimation https://github.com/privacy-scaling-explorations/snark-verifier/blob/main/snark-verifier/src/loader/evm/util.rs#L97.

GPU

Q: Does Halo2 real prover use GPU? (for e.g. in M1/M2 chip series laptops)

A: No. Although you can use pasta-msm crate to derive ECC ops to GPU. (It can require to adapt things a bit)

Q: I have a very general question about the Circuit trait: as we have to define gates & columns within fn configure(meta: &mut ConstraintSystem<F>) -> Self::Config;, all gate configurations have to be known at compile time, unless I’m overlooking something! I don’t see a good reason for this, at key generation time should be enough? In my case, I’m implementing a prover for a machine learning model, and some gate constraints depend on the model structure, which is not fixed at compile time. See also my issue here: https://github.com/zcash/halo2/issues/771

A: i would recommend looking at how ezkl does it! will try to find a more specific example later: https://github.com/zkonduit/ezkl

Reply ： Thanks, that was good advice! It turns out that halo2 has a circuit-params feature, which does exactly what I need here. I’ll put more details in the linked issue for future reference and close it. Looks like it only works in the PSE fork though, was merged 3 weeks ago: https://github.com/privacy-scaling-explorations/halo2/pull/168

trusted setups

Hi guys, do you know where to find trusted setups for a kzg-based ceremony?

https://github.com/iden3/snarkjs#7-prepare-phase-2

Q: What is the correct way to use that?

#![allow(unused)]
fn main() {
let f = File::open("src/powers_of_tau/powersOfTau28_hez_final_18.ptau")
    .expect("couldn't load params");

let mut reader = BufReader::new(f);

let params = ParamsKZG::<Bn256>::read(&mut reader).expect("Failed to read params");
}

When running this I get the error Failed to read params: Custom { kind: InvalidData, error: “input number is not less than field modulus” }

CPerezz: Are you sure that the endianness and format are the same for the Bn256 struct and the ptau file elements?

No, I’m not. Mine was more of a naive effort 🥲

I think this is probably the issue. You should just generate a trusted setup with Halo2 and figure out the serialization differences later. Once you need to use the actual ptau

For using existing KZG trusted setup, we have already converted perpetual-power-of-tau and hermez into pse/halo2 format here (https://github.com/han0110/halo2-kzg-srs), so we can download and use directly, or in the same repo it also has a script for us to do the conversion manually.

circuit `k`

Q: Whats the max number of rows in PSE’s Halo 2? Ive heard k=28 (2^28) through the grapevine, but I cant find anything anywhere that says this.

A: I think @CPerezz @Han could point you to this; iirc, the trusted setup was 2^28 since that’s the two-adicity of the BN254 scalar field, but i think they limited their circuits to 2^25 to allow for higher-degree constraints.

I think $2^{27}$ is the max you can use with Halo2 and BN. We have 1 spare root JIC. You will need 100’s of TB of RAM to compile a 2^28 circuit anyways. And yes, we capped the zkevm circuits to 2^25 max. And ideally would be nice to lower that

Q: Can we auto estimate minimum value of k given a circuit object? or is the only way to manually try to find it? (edited)

A: to get the minimum no. of rows required at configure time, you could do:

#![allow(unused)]
fn main() {
let mut cs = ConstraintSystem::<Fp>::default();
MyCircuit::configure(&mut cs);
println!("minimum rows: {}", cs.minimum_rows());
}

for synthesis it’s a little trickier.
when making a real proof, we would likely already be working with some hard-coded k in the params (e.g. random generators for IPA, powers of tau for KZG).
but for dev purposes, i think we could write a FloorPlanner that just returns the no. of rows used.

thanks, this is very helpful for setting k for dev purposes cs.minimum_rows().ilog2() + 1

for synthesis it’s a little trickier.

I just realised it doesn’t include synthesis. Is it still possible to estimate a value of k inclusive of synthesis? E.g. let the synthesis run without a row bound and see how much it consumes, so it does not require inputting value of k in MockProver and for other utilities e.g. generating diagrams.

negative/overflow

Q: Is there any way to express negative values in Halo2 witness cells? I assume the answer is no since there are no integers in Fp. Checking for confirmation

Daira: The most efficient encoding of a negative value -x is usually as p-x. Obviously you will have to consider the possibility of overflows.

Can you please explain what would be a case in which an overflow may cause odd behaviours?

suppose for example that the circuit is checking a nullifier for a Zcash-like cryptocurrency. If more than one possible value is accepted for the nullifier, then there is a double-spend bug. Depending on other details of the circuit, it’s likely that an overflow would allow that.

For example, if the range check on α described at https://zcash.github.io/halo2/design/gadgets/ecc/fixed-base-scalar-mul.html#base-field-element were not performed, then you could witness two possible values of α (by varying ψ) that give the same nullifier. This could also occur if there were any mistake in the range check due to overflow. Fixed-base scalar multiplication - The halo2 Book

(As it happens, the correctness of the range check actually relies on underflow in the case where it constrains 0 ≤ α_0+ 2^130 − t_p < 2^130. So overflow or underflow is not always harmful as long as it’s accounted for.)

F_r / F_q …

Hi I saw you’re also in the PSE discord and hence I think asking you would be better. If I’m trying to modify the sha256 gadget for halo2wrong how can I know where should I use Fq and where to use Fr? More generally how should the fields change?

CPerezz — 02/27/2023 5:12 PM You should use the Scalar field always. If you’te using halo2wrong with Bn you should use Fr IIRC

What you want is basically to port the gadget to halo2wrong API/chip. Is that right?

wait to be organized…

Q Hi, how is it possible to constrain equality between an instance cell and an advice cell without first using assign_advice_from_instance() followed by constrain_equal ?

Because calling assign_advice_from_instance() adds 25% proving time. I gather since this issue is still open, it is not possible yet https://github.com/zcash/halo2/pull/625

A assign_advice_from_instance() does precisely what you’d otherwise do manually (if we exposed APIs to directly constrain instance cells, which we don’t currently for UX reasons): it assigns the given advice cell with the same value as the instance cell holds, and then calls (effectively) constrain_equal. So the only difference between that and what you’re doing is that you have an additional constrain_equal call, and I don’t see how that could cause the prover to be 25% slower.

Q I struggle to find a place where parsing of operations for an Expression is being handled. It’s pretty clear how both evaluation and degree computation rules are defined, but isn’t there some structure like Abstract Syntax Tree, …? A Expression is defined here: https://github.com/zcash/halo2/blob/main/halo2_proofs/src/plonk/circuit.rs#L488-L509

there’s no parsing because you directly create instances of Expression using its operators and constructors for example, the operators are defined here: https://github.com/zcash/halo2/blob/main/halo2_proofs/src/plonk/circuit.rs#L723-L765

so Expression is the Abstract Syntax Tree type.

That I was able to understand, but the expression is coming from create gate function if I’m not wrong?

Normally, in the configure method of a chip, you would call query_* methods on the passed-in ConstraintSystem (which return Expressions), and then combine them with +, -, and *. Does that answer your question?

ahh yes I see…, operations are defined for Expression type so compiler will actually know to create AST from equation, it was obvious, not sure why i got confused with it

Q This might be a dumb Q:

I’ve been looking into the various ways witness generation works in ZK libs. In Circom for example, they do some crazy codegen from the Circom template code, and generate a .dat file + some Cpp which automagically generate the witness given some inputs. How does this work in Halo2?

A A1: There’s no magic; you write all of the code to generate witnesses in Rust. The API encourages you to do this in the same place as enabling the corresponding constraints. (That was a lesson we learned from libsnark where witness generation and constraint enforcement were separated; it was very error-prone.)

A2: The way it works in halo2_proofs is the same way it worked in bellman (drawing from the same learnings @Daira Emma (ze/hir) — ECC mentioned above): during synthesis, you write Rust code that uses AssignedCell, which wraps a pointer to a cell within the circuit and its assigned (if known) Value. You operate on the cells either directly or via gadgets, and every time a new cell is assigned, a closure is provided that evaluates to the value of that new cell. The closure is only evaluated when we need it (so for cells in advice columns, we only evaluate the closure during proving). The core idea is that the only spot where circuit synthesis and witness computation can significantly deviate is either inside that closure, or inside Value::map, which are both generally localised within the circuit synthesis code, and thus easier to compare against for bug finding.

Q How does one deal with variable length public inputs? I have a secp256k1 public key as a public input, but it can either be in uncompressed form (65 bytes) or compressed form (33 bytes). It is laid out in 65 or 33 rows of an instance column.

I want to write a gadget that verifies that an ECDSA signature corresponding to this key is correct. I plan to witness the public key in some advice columns (using halo2wrong techniques) and check that the bytes of this witnessed public key match the bytes in the instance column. Do I write constraints for both cases (65 and 33) and check that one of them is satisfied?

A if i’m understanding the formats correctly:

uncompressed: 0x04 | x | y
compressed: parity | x, where parity is either 0x02 or 0x03

we could do something like :

if the key is in the compressed form, pad it with 32 0 bytes, so that we always have a 65-byte public input;
use the first byte as a isCompressed flag;
copy in all 65 bytes of the key to advice cells;
- if isCompressed = 0x04 (uncompressed key), check that each witnessed byte equals each public input byte
- if isCompressed = 0x02 | 0x03 (compressed key), check equality of the x-coordinate bytes, and check that the last 32 bytes are all-zero

i think we would also need an extra parity consistency check in the compressed case. (i’m assuming that, in either case, we’ll need to witness the full y-coordinate in the circuit.)

Thanks for taking the time to explain this approach! This makes sense.

In addition, you need to check that the curve equation holds for the witnessed x and y coordinates

Is this to avoid an attack where a malicious y-coordinate could be used to verify a forged ECDSA signature?

It’s to avoid being able to forge proofs. If you don’t verify the curve equation then later constraints that assume the coordinates are valid will potentially be unsound. Also, for compressed encoding you have to implement the curve equation anyway to recover the y coordinate, so it’s no less expensive. In fact, what you’d do is witness the x and y coordinates with a curve check (like you’d do to witness any arbitrary curve point), witness the encoding, and then check consistency between the two (so checking the coordinates match for uncompressed, checking the sign bit of y for compressed).

Q Question about lookup tables: It seems that halo2 enforces that lookup tables have the same length. What do I do if I want them to have different lengths? A A1: Do you mean the fact that the tables themselves must have the same number of rows as the circuit? You just fill each table up with however many rows it needs, and the backend will fill the rest of the rows with an appropriate default value. Lookup tables need to live in separate fixed columns, so the fact that two tables have different “real” sizes doesn’t matter as they won’t interact (and the backend pads them to the same number of rows).

A2: to have two logically different tables “share” the same column, we could introduce an extra tag column that serves to index the tables. the inputs to the lookup argument would now also have to include an input_tag to specify which logical table it is using.

A3: I think we should handle this via the new dynamic table API (since that introduces the tag column, and does not actually require that the table uses only advice columns)

Q Hey everyone, I’m trying to get the max of two Values (ex: two Value<Fp> variables). Ideally I’d like to just compare the underlying field elements but it doesnt look like those field elements can be extracted(https://github.com/zcash/halo2/blob/main/halo2_proofs/src/circuit/value.rs#L11). Is there a quick workaround for this?

#![allow(unused)]
fn main() {
/// This behaves like `Option<V>` but differs in two key ways:
/// - It does not expose the enum cases, or provide an `Option::unwrap` equivalent. This
///   helps to ensure that unwitnessed values correctly propagate.
/// - It provides pass-through implementations of common traits such as `Add` and `Mul`,
///   for improved usability.
#[derive(Clone, Copy, Debug)]
pub struct Value<V> {
    inner: Option<V>,
}
}

A Hey everyone, I’m trying to get the max of two Values (ex: two Value<Fp> variables). Ideally I’d like to just compare the underlying field elements but it doesnt look like those field elements can be extracted(https://github.com/zcash/halo2/blob/main/halo2_proofs/src/circuit/value.rs#L11). Is there a quick workaround for this?

Q-1 Can you do a.zip(b).map(|(a, b)| f(a, b))?

A-2 i dont think so (unless the a, b are Fp vars) . so i think the issue is that Value doesnt implement the Ord trait which is what I want to be able to do comparisons on Values.

Q-2 Sorry, that was a bit confusing, this: a.zip(b).map(|(x, y)| f(x, y)), If a, b are Value<Fp>, I believe that inside the map the x, y are &Fp.

A-3 ah my bad, yea that’ll work. thanks !

A-4 Yep, that’s the intended way to implement operations that Value doesn’t expose

Q SUN-YI: On a related note, is there an intended way to check whether two Values contain the same inner Option? (I’d like to use this to test witness generation code programmatically, so I want to get a bool.)

A Use Value::assert_if_known or Value::error_if_known_and. You’d map the two values into one containing a tuple, then use the above methods.

Q SUN yi: I am in a situation where I’d like to read the inner value in a Value<F> for witness generation. Is this possible in any way in the 0.2.0 API?

The specific operation I want to do is:

I have a x: Vec<AssignedCell<F, F>> and a separate idx: AssignedCell<F, F> and I know that 0 <= idx.inner < x.len().
I’d like to find the array y so that y.len() = x.len() and y[i] == x[i] if i < idx.inner and y[i] is a newly assigned fixed 0 cell if i >= idx.inner. Is there some way to do this?

A lyt: where is i coming from? i think we’ll probably need an upper bound on how large i can be, i.e. how long the y vector can be str4d - ECC: In this scenario, the length of x is fixed in the circuit structure, as it is effectively Vec<Value<F>>. So what you want to do here is something like:

#![allow(unused)]
fn main() {
let mut y = vec![];
for (i, x_i) in x.iter().enumerate() {
    let y_i_val = x_i.value()
        .zip(idx.value())
        .map(|(x_i, idx)| {
            if i < idx {
                x_i
            } else {
                F::zero()
            }
        });
    let y_i = region.assign_advice(
        ...,
        || y_i_val,
    );
    y.push(y_i);
    // Also need to enable some
    // constraint that enforces the
    // relationship on each cell.
    // The constraint would be where
    // the fixed 0 gets constrained
    // once i >= idx.
}
}

SY: My understanding is this assigns a new cell for each cell in y. Is it possible to have the first idx cells in y simply be clones of the AssignedCells in x, thereby assigning fewer cells? (In the 0.1.0 API, I believe this was achievable by handling the None and Some(idx.inner) values for idx separately.)

Yes, but only if idx is baked into the circuit and not chosen by the prover. If idx is inherently a Value<usize> (i.e. Value::unknown() during keygen) then what you describe doing is a circuit bug. But if it’s a usize (i.e. known at keygen time) then yes, this can be done

I see — is the idea that the location of the cells in y in the grid must be fixed at keygen time?

Sort of. It’s more that the relationship between the cells defined as y, and the places that y is constrained later, need to be fixed at keygen time (as those constraints are your circuit). That means you can’t change which cells y refers to at proving time, or you are leaving your circuit under-constrained, which is (usually) Bad.

Q hey, has there been any discussion around what determines the proof size ? A See the proof_size and marginal_proof_size methods in https://github.com/zcash/halo2/blob/main/halo2_proofs/src/dev/cost.rs

Q is there a standard library/implementation people use for range checks? A SY: We just open sourced a library of base components including range check here: https://github.com/axiom-crypto/halo2-lib/blob/main/halo2-base/src/gates/range.rs

Q How many advice columns is considered too many? Are 500 columns ok? I am trying to implement a circuit that can prove ownership of a Bitcoin UTXO. This involves activating gates in response to Bitcoin opcodes. There are about 200 such opcodes. Each opcode will require at least one column as an indicator function. If I don’t mind the large proof size (for now), is it feasible to have 500 columns in a halo2 circuit. A We previously had issues with that many columns because the Orchard circuit only used 10 so we hadn’t tested that high. But then the zkEVM people came along with a similar issue (EVM opcodes) and started exercising those dimensions, and a bunch of performance improvements have been made that should mean it works fine now.

Q Jason m: Getting stochastic failure (proof sometimes verifying, sometimes not verifiying), even with the same pk held in memory. Any guesses as to why? I will work on a minimal example, but if anyone knows of another place this has happened, we would appreciate a pointer.

A-1: I have encountered the similar issue while some logic in the synthesis iterates a HashMap. I saw in ezkl while model configuration, it also iterates over a HashMap to configure the ConstraintSystem, which might lead to constraints with different order (then verifying would fail). Could this be the issue?

Q-1 Could be! Will check it out. ……. Looks quite likely that this is the problem, once we finish confirming it we will switch that HashMap that snuck in with BTreeMap. Thank you @Han !!

Q Hi, I’m trying to prove that a certain ASCII character X is not present in a string. What would be a more efficient way to do it? I could put all ASCII chars (except X) in a lookup table and prove that the string contains only the chars from the lookup table (Ideally, I could use a multiset equality check but it is still wip in halo2) Is there any better way than the lookup table? Thanks.

A-1 : The simplest way would be to have a constraint of the form char - NUMERIC_VALUE(‘X’) != 0, which you can do by witnessing inv = (char - NUMERIC_VALUE(‘X’))^{-1} and then constraining (char - NUMERIC_VALUE(‘X’)) * inv = 1. This requires that char is also range-constrained to ASCII (e.g. range constrain to 7 bits).

Q-1: thank you very much. Just to clarify: you think that this approach will cost less prover time than lookup tables, correct?

A-1: Probably; the two constraints here are relatively simple. But the lookup table would also be relatively small in this instance, so best way to know is to try both.

Q We are facing a rather curious issue. The MockProver works as expected and verifies the circuit execution but the real verification fails with ConstraintSystemFailure.

Is there any known issues regarding MockProver that justifies this behaviour?
Generally what is the right debugging approach in this scenario?

A This is likely because MockProver does not check everything. We add more comprehensive checks over time, but it’s a development and debugging tool rather than an alternative to full verification. That being said, we’d like to figure out what these edge cases are so we can track improvements to MockProver. The easiest debugging approach currently is to gradually comment out parts of your circuit until the error goes away. That and adding print statements to determine how far through synthesis you got. Overhauling the error handling has been on the backlog for a while; I’d ideally want the error you saw to already include this information.

Q Hello, does anyone have a good code example of a circuit that uses the V1 floor planner? I’m trying to switch my circuit to it, but it expects my circuit’s synthesize function to work on the default circuit (from without_witnesses), which it’s not designed to do. I’m assuming to fix this I’ll need to refactor to use the Value enum everywhere, but before I start on that I’d love to see a working example using the V1 floor planner

A If your circuit doesn’t synthesize with the default circuit, then it very likely has bugs. More specifically, Circuit::without_witnesses shouldn’t return Self::default(), but should instead construct a copy of self that omits witnesses (anything you currently store as Option<T> and would store as Value<T> after the refactor), but including everything else. That is necessary because the “everything else” is necessarily affecting the structure of the circuit, and the structure of the circuit must not change between calls to synthesize. This doesn’t just affect the V1 floor planner; it affects the simple one as well, because keygen calls synthesize without any witnesses.

Q-1： Huh, I haven’t had any problems using the simplefloorplanner with my circuit; both using the mockprover and proving/verifying real proofs I’ll definitely change my circuit to reflect the ‘proper’ way of doing without_witnesses though. Although you may want to change the examples to reflect this design, since most current examples given use Self::default() for without_witnesses Thanks for the tips!

A-1： Yep, there’s an open issue for changing the examples: https://github.com/zcash/halo2/issues/613 Self::default() works fine if Self only contains witness variables, and none of the examples have structural variables in Self.

Zcash’s Orchard circuit uses the V1 floor planner: https://github.com/zcash/orchard/blob/main/src/circuit.rs#L191

Q I am trying to understand a halo2 circuit layout using the dev-graph feature. In the attached picture, the green regions seem to correspond to assigned rows of some columns. What do the other colors correspond to? I want to understand why there is a large orange region in the middle which has the same color as the unused rows.

A The orange background indicates the advice columns, and the blue background indicates the fixed columns. The line showing how many rows are used is down past the middle because of one of the fixed columns that assigns to that row, while the advice columns are barely used.

Q-1 Thanks! I am using the halo2wrong ECDSA chip. I think the tall fixed column is 18-bit range check which takes up 2^18 rows. The advice columns in the middle have only one row used. It’s rendering is so thin compared to the rest of the columns that it is invisible. The green columns have a darker shade of green in some rows. Does that correspond to cells that have been assigned? … Also, the rightmost fixed column has a darker shade of blue. Does that signify anything?

A-1 The darker blue indicates selector columns, which are a specialized subset of the fixed columns.

A-2 And yes the darker green corresponds to assigned cells. (It is actually possible to assign the same value more than once, which I think produces an even darker green; this is useful to debug overlaps when zoomed in.)

How many rows are used by halo2 “system” at the bottom of the matrix? A It is “dynamic” in that it depends on your circuit structure. Put another way, you don’t pay blinding rows for functionality you aren’t using. The actual calculation is here: https://github.com/zcash/halo2/blob/ec9dcefe9103fc23c13e8195120419d4d2f232a6/halo2_proofs/src/plonk/circuit.rs#L1432-L1472

#![allow(unused)]
fn main() {
    /// Compute the number of blinding factors necessary to perfectly blind
    /// each of the prover's witness polynomials.
    pub fn blinding_factors(&self) -> usize {
        // All of the prover's advice columns are evaluated at no more than
        let factors = *self.num_advice_queries.iter().max().unwrap_or(&1);
        // distinct points during gate checks.

        // - The permutation argument witness polynomials are evaluated at most 3 times.
        // - Each lookup argument has independent witness polynomials, and they are
        //   evaluated at most 2 times.
        let factors = std::cmp::max(3, factors);
...
}

Thank you, this is the calculation I was looking for. So the max assignable rows should be 2^k - meta.minimum_rows(), where the call to minimum_rows happens at the end of layout (because it increases as queries occur)?

Yeah. This is also why the “not enough rows” error doesn’t suggest a value of k that will fix the problem, because it was always suggesting current_k + 1 and then immediately encountering the error again as we progress further through Circuit::synthesize.

Q Is the protocol described here https://zcash.github.io/halo2/design/protocol.html same as the actual protocol that has been implemented in the zcash’s halo2 repo? A Yes. That page matches what the halo2_proofs crate currently implements, and provides a security argument. If in future backwards-incompatible changes are made to what halo2_proofs implements (which are likely necessary for implementing recursion/recursive), that page will also be updated.

Q how difficult would it be to swap the Pasta curves in the IPA of zcash/halo2 with Secp256k1 curves, as implemented here: https://github.com/privacy-scaling-explorations/halo2curves/tree/main/src/secp256k1 I know FFT would be slower but for example, private secp256k1 ECDSA signature verification inside the circuit would be very few constraints due to no wrong field arithmetic? A Definitely doable; secp256k1 has the necessary curve cycle. The main issue currently is that there are extension traits in pasta_curves that halo2_proofs depends on, so you’d need to maintain a dependency on pasta_curves for now (though we are working on moving these pieces upstream into ff and group). There might also be a few spots inside zcash/halo2 where we explicitly depend on pasta_curves curve types, though I think those are in halo2_gadgets (just places we didn’t have time to generalise while implementing Orchard), and halo2_proofs is fully generic?

Q-2: Appreciate the speedy reply! It looks like in the README they’ve implemented the halo2 traits for FieldExt and CurveExt for these curves as well, so does that cover the first part of what you are saying?

Yeah, that should be sufficient

I got it done! yay! (I got secp256k1 working for the IPA in a very simple proof. still need to benchmark the full ECDSA signature verification code)

Q Referring to this doc https://zcash.github.io/halo2/design/protocol.html, Is this correct to consider that lookup gates are included in the description of the function g(X, …) ?

Also, what are the polynomials s_i(X) that are being constructed in step 10 ?

A Conceptually yes. The actual constraints depend on two challenges β and γ that must be sampled after committing to the other columns — i.e. other than (A’, S’, Z computed in the lookup argument and the product columns in the permutation argument) I don’t see the sampling of those challenges in the protocol steps; maybe they were merged with some of the x_i or maybe those steps are just missing (you’d have to look at the code to check, or @seanzcash would know). In any case we use β and γ for both the lookup argument and the permutation argument

Q Can you give an intuition on why multiplying (1 - q_last(X) - q_blind(X)) polynomial helps in imparting zk to both lookup and permutation arguments? I noticed that this is different than how it was done in the Plonk paper. A It’s not that it helps impart zk to those arguments, but that it is necessary to prevent those arguments from being broken by the way we do zk in Halo 2. We require some number of “blinding rows” in the table, which are assigned random values in the advice polynomials. These random values cannot participate in the lookup and permutation arguments because their contents are by definition random and thus don’t follow e.g. the sorting / arranging requirements of the A’ and S’ polynomials in the lookup argument. So we use the above constraint factor to ensure that the blinding rows are unconstrained by the lookup and permutation arguments.

A-2: if zk were not needed, then the description of the protocol before “Zero-knowledge adjustment” would work. But that relies on the references to next and previous rows “wrapping around” at the last and first row respectively. If there are blinding rows that have random contents, then the constraints would not be satisfied at those rows

Q If I want to prove that an advice column is a permutation of a fixed column, what API call can I make inside meta.create_gate to generate the permutation proof? A this is a multiset equality check and there is currently no API for it: https://github.com/zcash/halo2/pull/669

you could use meta.lookup to check that every entry in the advice column appears somewhere in the fixed column; but this isn’t the same as checking that it’s a complete permutation of the fixed column.

Q Hi I am currently working on a ZK SNARK system with verifier within smart contract on an ethereum-based blockchain. The system currently works with GM17 protocol and verifier is mostly generated by a tool which creates Solidity file for it.

I am not sure if that is possible to bring Halo2 verifier to EVM since compiling Rust code is not an option I am aware of (there is EWASM but as far as I know it’s under development and not coming any time soon) and writing verifier from scratch in Solidity seems like a lot of challenge. So I would like to know if anyone is aware of any way to bring Halo2 verifier to EVM or heard of any work in this direction. Any help or advice would be greatly appreciated

A I have not dug very deep yet but I asked this question in a different discord and was pointed to Scroll’s work: https://github.com/scroll-tech/halo2-snark-aggregator/tree/main/halo2-snark-aggregator-solidity I am not experienced enough with it to tell you whether or not this is a usable SDK for putting Halo 2 proofs on-chain, or if you would have to use it as an example and copy a bunch of boilerplate code to do so

There is also generic PLONK verifier from PSE team’s work(https://github.com/privacy-scaling-explorations/plonk-verifier) which generates Yul verifier internally. It can work as PSE’s Halo2 verifier itself. (Not sure whether it works for ZCash halo2)

Q hi, is there any example of a simple circuit where an instance column is used in create_gate. So, no constrain_instance is used. All the examples that I see constrain a cell to instance column cell.

For example, a circuit where the element wise product of two advice columns (a,b) is equal to the instance column (c). I created a gate specifying a*b-c, and assigned a,b through layouter.assign_region, but looks like I am missing something as the MockProver is failing. Anything more that i need to do?

A Instance columns can’t be easily used directly in gates, because gates are enabled relative to regions, and regions can be arbitrarily reordered, while instance column contents cannot. If I recall correctly, it still might be possible to set this up, but you’d need to be using a floor planner that does not do any packing, which is less efficient.

I see. since i am just developing a toy circuit, I used SimpleFloorPlanner. After I posted the question, I updated the gate to be q_sel*(a*b-c), and it worked. So looks like a selected is always necessary to pass?

The mock prover might be making assumptions about gates having selectors? But it shouldn’t, since that isn’t strictly required.

Q is there any documentation using a real prover/verifier for a halo2 circuit? A there’s a PR for this: https://github.com/zcash/halo2/pull/670/files#diff-93ad4e38438d6dd3ae11bc620ae22751d0d80f38a3e44695944de044078e568eR340 Also there is this test https://github.com/zcash/halo2/blob/main/halo2_proofs/tests/plonk_api.rs

Q Is it possible to use halo2 with gpu, when creating a proof? A Not yet, but there is work being done towards this that will hopefully make its way into halo2_proofs in the near future.

Q Hello! Noob question, wondering what the “Z” and “U” values for a fixed base are. (https://github.com/zcash/halo2/blob/677866d65362c0de7a00120c515a9583b2da2128/halo2_gadgets/src/ecc/chip/constants.rs#L150-L156) https://github.com/zcash/halo2/blob/677866d65362c0de7a00120c515a9583b2da2128/halo2_gadgets/src/ecc/chip/constants.rs#L108-L117 is find_zs_and_us so I think I can just use it without knowing why it works

A So for a table of w points we should be able to represent the choices of y-coordinates in w bits. Alternatively, if we have some piece of information (represented by a single field element z for each table) that “randomly” generates those bits, and provided w is not too large, then we can search for z that happens to generate the correct values for the w bits Half of all field elements are squares. So, there may (will, because the field is large) exist z such that z + y is square and z - y isn’t, for every point (x, y) in the window table. Then if the prover witnesses a square root u of z + y, and we also check the curve equation, then we know that we have the correct y (and not its negation)

Q Hello frens, Im trying to write create a WASM version of Poseidon hash. I started implementing the WASM wrapper and ran into an issue very early on. When adding halo2_gadgets and halo2_proofs as dependencies. https://github.com/ImmanuelSegol/zk-benchmarks/blob/main/halo2-wasm/Cargo.toml

I get the following error when compiling:

Anyone know why this happens ? Im abit new to rust as well so maybe im missing smtn. but shouldn’t t halo2_gadgets and halo2_proofs be includable in a wasm project without throwing an error. if i remove halo2_gadgets and halo2_proofs my wasm compiles correctly Thanks

Q what is the reasoning behind the fact that From<u64> is only enforced by PrimeField and not by Field directly?? It’s annoying in halo2 where sometimes you would be Ok with F:Field as trait bounds and you need to add extra stuff just due to this 😦

I’m sure I’m missing something here. Could you enlight me?

A I guess there is always a well-defined embedding of Fp into F{p^k}, but it isn’t entirely obvious to me that this is what you would want for a From conversion. (Consider for example F{2^64}; should that just discard all but the low bit?)

Q: Hey Daira! I’m not sure how this is linked to the trait itself. The main difference between Field and PrimeField is just that, that one of them is guaranteed to be Prime order and so, has extra methods avaliable. And this doesn’t really apply to From<u64>. My concern was more towards rust-API perspective as I did not think that this had something to do with theoretical background.

A: Finite fields can be either prime or extension fields. My point is, what’s the intended semantics for From<u64> on an extension field? It isn’t obvious.

Q Ohh I see. I don’t think the distinction applies for extension fields. I would never expect From<u64> to have anything to do with exponentiation even if working with extension fields. It’ll purely: turn into F encoding-form this u64 value. For what you were referring, I’ll always expect the need to do: let x = F::from(2u64).pow*&[64u64,0,0,0]) to express F{2^64}. (edited) A So, if you know that you don’t have an extension field, what stops you from using the PrimeField trait as a bound? (Genuine question.)

Q: Ohhh mainly the fact that I leave a way less fn calls avaliable open and we save compilation time. If I can restrict more the trait, it allows to call a lot less stuff and also, the compiler has less things to worry about. My question is also genuine in the sense that I don’t really purpose to change it. But it’s like having F::ONE as PrimeField instead of Field. Is such a basic thing that I’d expect to get it from the Field trait directly.

str4d - ECC：

@CPerezz the core question is “how should a u64 integer be mapped into the field?” This question is easy to answer for prime fields: there is a 1:1 mapping as long as the field is at least 65 bits. ff_derive supports a minimum of 64 bits for modulus size, so in that case there may be a slight reduction, but it’s not too noticeable. For binary or extension fields the question is harder to answer, and will depend on the structure of the field. There is not an obvious mapping that is correct for every possible field.

This is also why we have Field::ZERO and Field::ONE, but only PrimeField::TWO_INV. The first two are valid for every field (because fields have both addition and multiplication, and therefore must have both additive and multiplicative identities), whereas 2^-1 is only present for fields in which 2 has an inverse (which does not include binary fields).

Others

Q JM: enable_equality is completely idempotent, right??

“idempotent”（幂等）这个术语通常用来描述一个具有特定性质的操作：无论进行多少次，其效果都是一样的。当我们说一个操作是“完全幂等的”（completely idempotent）时，我们是在强调这一点：不管这个操作执行一次还是多次，结果总是相同的。

A You mean the API that enables a column to be used in equality constraints? Yes, using it multiple times on the same column has no additional effect.

Q jasonmorton： What’s the difference between Constant (constrain_constant) and Fixed (assign_fixed)? Both use a cell for a value that is fixed at circuit creation time, and is part of the circuit definition. Which one is most appropriate for values to be used in constraints? I want to add (as cheaply as possible) the constraint 3x+5y=0, where x and y are witness values and 3 and 5 are fixed when the circuit is defined.

A assign_fixed should be used for values in constraints, because the constraint has to be enabled at some relative offset within the region. 因为必须在区域内的某个相对偏移处启用约束。

constrain_constant assigns a value in some unused fixed cell after all regions have been allocated; it should be used to equality-constrain single cells in the global permutation. constrain_constant 在分配所有区域后在某个未使用的固定单元中分配一个值；它应该用于在全局排列中平等约束单个单元。

Q Thank you. Is using assign_fixed with a fixed column, and assign_advice with an advice column the same prover and verification cost then? A No; roughly speaking, advice columns are more expensive

Q: hey a question about PSE Halo2, can anyone guide me on how to extract kzg inclusion proof from a column’s polynomial commitment? I am tracking back the code from transcript.write_point() and can figure out where the commitment is calculated, but any guidance will be helpful

A: here is where the KZG opening proof is made for multiple commitments evaluated at the same point z:

https://github.com/privacy-scaling-explorations/halo2/blob/main/halo2_proofs/src/poly/kzg/multiopen/gwc/prover.rs

Q is halo2 book is enough to read and develop the circuit? A To read it possibly. To develop it, depends on your programming experience and the languages you’re good at. As this will probably mark how fast you get up to speed with Rust basics.

Q How come there are so many duplicated traits? Curve, CurveExt Field, FieldExt Group, Group (same name! one from group, one from pasta_curves) I have to be honest, it’s a bit confusing.

A The *Ext traits are extension traits, a way of extending an existing trait with additional functionality. We wrote those while figuring out what things we needed for implementing Halo 2 that the ff and group traits didn’t yet provide. The end goal is for those extension traits to disappear:

https://github.com/zcash/pasta_curves/issues/42
https://github.com/zcash/pasta_curves/issues/41

Q hey! is anyone working on (or aware of anyone working on) transpiling r1cs constraints to halo2 circuit?

A Why not just change the protocol to support R1CS? That would be more efficient, no? Halo 2 is made to prove a PLONKish circuit. If you just want to support R1CS, you could drop lookups, etc.

Transpiling should be more efficient, because you can make use of multiple columns to compile more than one R1CS constraint into a single PLONKish row Depending on the sophistication of the compiler, you could also recognise repeated patterns in the R1CS constraints and compile them into custom gates, although I’m not sure whether it would be worth the effort relative to rewriting the source circuits

Prerequisite

The Halo2 Book:

0xPARC: Halo2 Learning Group

Official : https://learn.0xparc.org/halo2/
https://github.com/icemelon/halo2-tutorial/
1. Introduction 8.21
2. Halo2 API & Building a Basic Fibonacci Circuit (Part 1)
- https://github.com/icemelon/halo2-examples (Haicheng’s Code)
- https://github.com/enricobottazzi/halo2-fibonacci-ex 整理了 0XPARC 课上的 QA ! and Example2 Example 3 …
- https://github.com/therealyingtong/halo2-hope code reference
- https://github.com/jasonmorton/halo2-examples/blob/master/src/range_check/example1b.rs Jason Morton 超详细注释 line by line
- https://github.com/enricobottazzi/halo2-intro
Fibonacci Circuits cont. + Basic Halo2 gadgets
- Jason Morton Code missed Haicheng’s print part.

StarLi 星想法

01 - Halo2入门基础介绍 StarLI-Trapdoor
02 - Halo2 深入理解Permutation & Lookup算法
03 - Halo2协议基础及介绍 25’ 左右对整体协议的介绍
04 - Halo2电路进阶 (sha256 优化实现)
- 如何实现 (mod $2^{32}$ ) 加法 ?
- 如何实现 XOR (有些代码很 make sense ) 值得再看
05 - Halo2源代码导读
- https://mp.weixin.qq.com/s/VerLN8-tqetKs1Hv6m4KLg
Halo2 开发常见错误 (Custom Gate)

知乎小白专栏:

零知识证明原理及区块链应用分享
Plookup 原理详解 扩展到multiple tables 部分 make sense, 但是公式太不清晰了, 可以重新回头看
Halo2: Lookup argument 主要是 halo2 book 的 Proving System 部分的讲解, zero knowledge 部分很 make sense, 值得再读
Halo2：原理剖析简易大纲
V神如何巧妙讲解

DoraHacks

零知识证明：Halo2解读乏善可陈…

Code

Halo2 Tutorial Intro
- 提供了 ECDSA / 等 gadgets , 值得再读 …
- 提供了 Range check 等 gadgets , 值得再读 …
Develop Circuits Using Halo 2 对 ZCash $a^{2} + b^{2} = c$ 的 Tutorial , 图解非常好, 搭配 ZCash 的翻译一起看
Building a Zero Knowledge web app with Halo 2 and Wasm (part 1) Very Goods！
zordle 讲解清晰!
Awesome HALO2
halo2 tutorial From HaiCheng Shen 沈海诚 code
https://github.com/Divide-By-0/halo2-learning-group

libs:

More Optimized ECC Operations in halo2 by Axiom
axiom libs.
- SY: We just open sourced a library of base components including range check here: https://github.com/axiom-crypto/halo2-lib/blob/main/halo2-base/src/gates/range.rs
- https://axiom-crypto.github.io/halo2-lib/halo2_base/gates/range/trait.RangeInstructions.html#tymethod.is_less_than
- This uses halo2-lib: https://github.com/axiom-crypto/halo2-lib
- YT: it looks like the axiom fork does variable-length Poseidon (https://github.com/axiom-crypto/halo2/tree/main/primitives/poseidon):
- ECDSA: https://github.com/axiom-crypto/halo2-lib/blob/main/halo2-ecc/src/secp256k1/tests/ecdsa.rs

Others :

Records:

Little Things I’ve Learned in Developing Halo2 Circuits by Chih-Cheng Liang | Devcon Bogotá

论文: BCH19 Recursive proof composition without a trusted Setup

Prerequisite

The Halo2 Book:

0xPARC: Halo2 Learning Group

Official : https://learn.0xparc.org/halo2/
https://github.com/icemelon/halo2-tutorial/
1. Introduction 8.21
2. Halo2 API & Building a Basic Fibonacci Circuit (Part 1)
- https://github.com/icemelon/halo2-examples (Haicheng’s Code)
- https://github.com/enricobottazzi/halo2-fibonacci-ex 整理了 0XPARC 课上的 QA ! and Example2 Example 3 …
- https://github.com/therealyingtong/halo2-hope code reference
- https://github.com/jasonmorton/halo2-examples/blob/master/src/range_check/example1b.rs Jason Morton 超详细注释 line by line
- https://github.com/enricobottazzi/halo2-intro
Fibonacci Circuits cont. + Basic Halo2 gadgets
- Jason Morton Code missed Haicheng’s print part.

StarLi 星想法

01 - Halo2入门基础介绍 StarLI-Trapdoor
02 - Halo2 深入理解Permutation & Lookup算法
03 - Halo2协议基础及介绍 25’ 左右对整体协议的介绍
04 - Halo2电路进阶 (sha256 优化实现)
- 如何实现 (mod $2^{32}$ ) 加法 ?
- 如何实现 XOR (有些代码很 make sense ) 值得再看
05 - Halo2源代码导读
- https://mp.weixin.qq.com/s/VerLN8-tqetKs1Hv6m4KLg
Halo2 开发常见错误 (Custom Gate)

知乎小白专栏:

零知识证明原理及区块链应用分享
Plookup 原理详解 扩展到multiple tables 部分 make sense, 但是公式太不清晰了, 可以重新回头看
Halo2: Lookup argument 主要是 halo2 book 的 Proving System 部分的讲解, zero knowledge 部分很 make sense, 值得再读
Halo2：原理剖析简易大纲
V神如何巧妙讲解

DoraHacks

零知识证明：Halo2解读乏善可陈…

Code

Halo2 Tutorial Intro
- 提供了 ECDSA / 等 gadgets , 值得再读 …
- 提供了 Range check 等 gadgets , 值得再读 …
Develop Circuits Using Halo 2 对 ZCash $a^{2} + b^{2} = c$ 的 Tutorial , 图解非常好, 搭配 ZCash 的翻译一起看
Building a Zero Knowledge web app with Halo 2 and Wasm (part 1) Very Goods！
zordle 讲解清晰!
Awesome HALO2
halo2 tutorial From HaiCheng Shen 沈海诚 code
https://github.com/Divide-By-0/halo2-learning-group

libs:

More Optimized ECC Operations in halo2 by Axiom
axiom libs.
- SY: We just open sourced a library of base components including range check here: https://github.com/axiom-crypto/halo2-lib/blob/main/halo2-base/src/gates/range.rs
- https://axiom-crypto.github.io/halo2-lib/halo2_base/gates/range/trait.RangeInstructions.html#tymethod.is_less_than
- This uses halo2-lib: https://github.com/axiom-crypto/halo2-lib
- YT: it looks like the axiom fork does variable-length Poseidon (https://github.com/axiom-crypto/halo2/tree/main/primitives/poseidon):
- ECDSA: https://github.com/axiom-crypto/halo2-lib/blob/main/halo2-ecc/src/secp256k1/tests/ecdsa.rs

Others :

Records:

Little Things I’ve Learned in Developing Halo2 Circuits by Chih-Cheng Liang | Devcon Bogotá

论文: BCH19 Recursive proof composition without a trusted Setup

author: @Demian

references: https://learn.0xparc.org/halo2/

Overview

简单例子

我们先从一个简单的电路开始，介绍常用的 API 以及它们的使用方法。该电路将采用 public input c，并将证明两个 private inputs $a$ and $b$ 的知识，以使 $a^{2} \cdot b^{2} = c$

定义 instructions

首先，我们需要定义我们的电路所依赖的指令集(instructions)

Instructions 介于 high-level gadgets 和底层的电路操作之间。指令既可以细粒度也可以粗粒度，但在实践中，指令的功能应当足够小，这样可以重复使用；但又要足够大，这样可以优化它的实现。设计者应当在这两者之间取得平衡

对于我们的电路，我们将使用三个 instructions：

将 private number 加载到电路中。
两个数字相乘。
将数字公开(Expose) 为电路的 public input。

我们还需要一个代表数字的变量的类型(type Num)。指令接口(Instruction interfaces) 为其输入和输出提供关联类型(associated types)，以允许实现以对其优化目标最有意义的方式表示这些类型 (to allow the implementations to represent these in a way that makes the most sense for their optimization goals.)

#![allow(unused)]
fn main() {
trait NumericInstructions<F: Field>: Chip<F> {
    /// Variable representing a number. 用于表示一个数的变量
    type Num;

    /// Loads a number into the circuit as a private input. 加载隐私输入
    fn load_private(&self, layouter: impl Layouter<F>, a: Value<F>) -> Result<Self::Num, Error>;

    /// Loads a number into the circuit as a fixed constant.
    fn load_constant(&self, layouter: impl Layouter<F>, constant: F) -> Result<Self::Num, Error>;

    /// Returns `c = a * b`.
    fn mul(
        &self,
        layouter: impl Layouter<F>,
        a: Self::Num,
        b: Self::Num,
    ) -> Result<Self::Num, Error>;

    /// Exposes a number as a public input to the circuit.
    /// 将一个数置为电路的公开输入
    fn expose_public(
        &self,
        layouter: impl Layouter<F>,
        num: Self::Num,
        row: usize,
    ) -> Result<(), Error>;
}
}

Among them,

Num 用于适配此 interface 中处理的类型
load_private 用于加载 witness
load_constant 用于加载常量 (constant)
mul 用于计算两个数字的乘法
expose_public 用于设置实例 (instance)

定义芯片的实现

对于我们的电路，我们将构建一个芯片(chip)，在有限域上实现提到的 Numeric Instruction (trait NumericInstructions)

如果您想开发自定义 chip，则需要去实现 Halo 2 的 chip Trait

大多数时候，使用 Halo 2 进行电路开发不需要自己定义 Instructions 和 chip。但如果你需要使用 Halo 2 没有提供的复杂算法，就需要自己实现（例如实现一种新兴的密码算法）。

#![allow(unused)]
fn main() {
/// 这块芯片将实现我们的指令集 instructions！
/// 芯片存储它们自己的配置，以及(如有必要的) 类型标记
struct FieldChip<F: Field> {
    config: FieldConfig,
    _marker: PhantomData<F>,
}
}

每一个“芯片“类型都要实现 Chip trait , Chip trait 定义了 Layouter 在 synthesizing 电路时可能需要的关于电路的某些属性，以及若将该芯片加载到电路所需要设置的任何初始状态

synthesizing 电路 : 一般指的是类似 R1CS 那种写约束的意思

#![allow(unused)]
fn main() {
/// Every chip needs to implement the `Chip` trait !!
impl<F: FieldExt> Chip<F> for FieldChip<F> {
    type Config = FieldConfig;
    type Loaded = ();

    fn config(&self) -> &Self::Config {
        &self.config
    }

    fn loaded(&self) -> &Self::Loaded {
        &()
    }
}
}

配置芯片

接下来需要为芯片 chip 配置好实现我们想要的功能所需要的那些列、置换、门（columns, permutations, and gates）：

#![allow(unused)]
fn main() {
/// 芯片 chip 的状态被存储在一个 FieldConfig 结构体中，它是在配置过程中由 chip 生成，
/// 并且存储在芯片内部 (type Config = FieldConfig;)
#[derive(Clone, Debug)]
struct FieldConfig {
    /// 对于这块芯片，我们将用到两个 advice 列来实现我们的指令集。
    /// 它们也是我们与电路其他部分进行通信的列。
    advice: [Column<Advice>; 2],
    instance: Column<Instance>, // public input 列（instance）

    // 我们需要一个 selector 来激活乘法门，在用不到 `NumericInstructions::mul`指令的 cells
    // 上不设置任何约束。这非常重要，尤其在构建更大型的电路的情况下，列会被多条指令集用到
    s_mul: Selector,
}
}

下面我们来构建约束 :

最关键的函数 configure 和 enable_equality 用于检查传入参数的相等性
如下图 : 在 create_gate 函数中 :
- 乘数 $(a, b)$ 分别在同一行的 $a_{0}, a_{1}$ advice 列 ;
- 乘积 $(o u t)$ 和 $a$ 同在 $a_{0}$ 列, $o u t$ 在 $a$ 的下一行 :
可以看到在代码中, 都是使用相对位置(relative position) 来描述的 !

#![allow(unused)]
fn main() {
// | a0  | a1  | s_mul |
// |-----|-----|-------|
// | lhs | rhs | s_mul |
// | out |     |       |
let lhs = meta.query_advice(advice[0], Rotation::cur());
let rhs = meta.query_advice(advice[1], Rotation::cur());
let out = meta.query_advice(advice[0], Rotation::next()); // Attention !!
}

最后函数返回多项式约束：

若选择器(Selector) s_mul 不为 0，则激活校验乘法约束 :
- 当 s_mul * (lhs * rhs - out) == 0，则说明 lhs * rhs = out 约束成立；
- 当 s_mul * (lhs * rhs - out) != 0，说明 lhs * rhs = out 约束不成立！！程序报错
若 s_mul 为 0，则不会激活检查乘法约束，any subsequent values are fine！

#![allow(unused)]
fn main() {
impl<F: FieldExt> FieldChip<F> {
    fn construct(config: <Self as Chip<F>>::Config) -> Self {
        Self {
            config,
            _marker: PhantomData,
        }
    }

    fn configure(
        meta: &mut ConstraintSystem<F>,
        advice: [Column<Advice>; 2],
        instance: Column<Instance>,
        constant: Column<Fixed>,
    ) -> <Self as Chip<F>>::Config {
        meta.enable_equality(instance);
        meta.enable_constant(constant);
        for column in &advice {
            meta.enable_equality(*column);
        }
        let s_mul = meta.selector();

        // 定义我们的乘法门（multiplication gate）
        meta.create_gate("mul", |meta| {
            // To implement multiplication, we need 3 advice `cells`
            // and 1 selector.  We arrange them like so:
            //
            // | a0  | a1  | s_mul |
            // |-----|-----|-------|
            // | lhs | rhs | s_mul |
            // | out |     |       |
            //
            // 门可以用任意相对偏移(relative offsets)，但每一个 offset 都会增加证明的开销
            // 最常见的偏移值 offset 是 0 (当前行), 1(下一行), -1(上一行)。
            // 这 3 种情况 `Rotation` 都有特定的 constructors : cur/next/prev
            let lhs = meta.query_advice(advice[0], Rotation::cur());
            let rhs = meta.query_advice(advice[1], Rotation::cur());
            let out = meta.query_advice(advice[0], Rotation::next());
            let s_mul = meta.query_selector(s_mul);

            // Finally, we return the polynomial expressions that constrain this gate.
            // 最终，我们将约束门的多项式表达式返回. 对于目前的乘法门，仅需要一个多项式约束
            //
            // `create_gate` 函数返回的多项式表达式，在 proving system 中会被约束等于 0.
            // 约束表达式有以下性质：
            // - 当 s_mul = 0 时，lhs, rhs, out 可以是任意值。
            // - 当 s_mul != 0 时，lhs, rhs, out 需要满足 lhs * rhs = out 这条约束。
            vec![s_mul * (lhs * rhs - out)]
        });

        FieldConfig {
            advice,
            instance,
            s_mul,
        }
    }
}
}

到目前为止，我们对电路的实现的大致过程是：

定义一套指令集（NumericInstructions），这是一套操作码，用来控制“计算机“(芯片)
变出一块芯片（定义在有限域上），就像是一块电路板
有了”指令集“和”电路板“，我们可以选择一些元件来对该电路板子实现特定功能(struct FieldConfig)，例如，如果想实现声控功能，我们需要电容麦，模拟-数字转换器 (ADC)，二极管… 在 halo2 中，我们就需要选取需要的 column: advice/instance/constant/selectors ….
有了这些元器件，我们需要按照执行逻辑将其连接起来(fn configure())

实现 chip Traits

我们前面定义的 instructions interface 需要 implemention，定义 NumericInstructions 的实现就是封装 finite field elements.

It should be noted that, 除了行和列之外，Cell 单元的位置还可以通过相对位置偏移(relative position offset) 来确定)

Generally, there are 3 types of offsets, 0 representing the current position, 1 representing the next position, and -1 representing the previous position.

#![allow(unused)]
fn main() {
struct Number<F: Field>(AssignedCell<F, F>); /// 用于表示数的 struct

impl<F: FieldExt> NumericInstructions<F> for FieldChip<F> {
    type Num = Number<F>;
    fn load_private(){ ... }
    fn load_constant(){ ... }

    fn mul(
        &self,
        mut layouter: impl Layouter<F>,
        a: Self::Num,
        b: Self::Num,
    ) -> Result<Self::Num, Error> {
        let config = self.config();

        layouter.assign_region(
            || "mul",
            |mut region: Region<'_, F>| {
                // 在此 region 中，我们只想用一个乘法门，所以我们在 region offset=0 处激活它；
                // 这意味着它将对 offsets 0 and 1 处的 2 个 cells 都进行约束(为啥？)
                config.s_mul.enable(&mut region, 0)?;

                // 给我们的输入(a: Self::Num / b: Self::Num,) 有可能在电路的任何位置.
                // 但在region 中，我们只能依靠相对偏移。所以我们需要在 region 内分配新的 cells
                // 并限制新分配的 cells 的值 与输入(a: Self::Num / b: Self::Num,) 的值相等。
                a.0.copy_advice(|| "lhs", &mut region, config.advice[0], 0)?;
                b.0.copy_advice(|| "rhs", &mut region, config.advice[1], 0)?;

                // 现在我们可以把乘积放到输出的位置了。
                let value = a.0.value().copied() * b.0.value();

				// 最后，我们对输出进行赋值，返回一个要在电路的另一部分使用的变量
                region
                    .assign_advice(|| "lhs * rhs", config.advice[0], 1, || value)
                    .map(Number)
            },
        )
    }
    fn expose_public(
        &self,
        mut layouter: impl Layouter<F>,
        num: Self::Num,
        row: usize,
    ) -> Result<(), Error> {
        let config = self.config();

        layouter.constrain_instance(num.0.cell(), config.instance, row)
    }
}
}

构建电路

现在我们有了所需的指令以及实现它们的芯片，我们终于可以构建我们的电路了！

circuit Trait 是电路开发的入口。我们需要定义自己的电路结构并访问 witness input

struct MyCircuit :

在这个结构体中，我们保存隐私输入变量。我们使用 Option<F> 类型是因为，在生成密钥阶段，他们不需要有任何的值。在证明阶段中，如果它们任一为 None 的话，将得到一个错误。

The interfaces defined before are all used here. configure creates a storage column for advice/instance/constant. synthesize uses a custom chip to get the input witness and constant, and finally, calculate the result and return the public input.

In fact, it can satisfy most scenarios by simply implementing the circuit trait for general circuit development. Some common functions of the chip have already been implemented in Halo 2.

#![allow(unused)]
fn main() {
// Store the private input variables in this circuit.
// Value<F> 用了 Option<F>,  因为在 key generation 阶段这个 struct 不会有值
// 而在 Proving 阶段，如果任意位置为空就会 throw Error.
struct MyCircuit<F: Field> {
    constant: F,
    a: Value<F>,
    b: Value<F>,
}

impl<F: Field> Circuit<F> for MyCircuit<F> {
    // 因为 we are using a single chip for everything，所以我们可以重用它的配置。
    type Config = FieldConfig;  // 电路元件(column(advice/instance/selector..))
    type FloorPlanner = SimpleFloorPlanner;

    fn without_witnesses(&self) -> Self {
        Self::default()
    }

    fn configure(meta: &mut ConstraintSystem<F>) -> Self::Config {
        // 我们创建两个 advice 列，作为 FieldChip 的 I/O.
        let advice = [meta.advice_column(), meta.advice_column()];

        // 我们还需要一个 instance 列来存储公开输入 public inputs.
        let instance = meta.instance_column();

        // 创建一个 fixed 列来加载常数 load constants.
        let constant = meta.fixed_column();

        FieldChip::configure(meta, advice, instance, constant)
    }
    // Prove a2⋅b2 = c
    fn synthesize(
        &self,
        config: Self::Config,
        mut layouter: impl Layouter<F>,
    ) -> Result<(), Error> {
        let field_chip = FieldChip::<F>::construct(config);

        // 将我们的隐私值加载到电路中。
        let a = field_chip.load_private(layouter.namespace(|| "load a"), self.a)?;
        let b = field_chip.load_private(layouter.namespace(|| "load b"), self.b)?;

        // 将常数因子加载到电路中
        let constant =
            field_chip.load_constant(layouter.namespace(|| "load constant"), self.constant)?;

        // 我们仅有乘法可用，因此我们按以下方法实现电路：
        //     asq  = a * a
        //     bsq  = b * b
        //     absq = asq * bsq
        //     c    = constant * asq*bsq
        //
        // 但是，按下面的方法实现，更加高效:
        //     ab   = a*b
        //     absq = ab^2
        //     c    = constant*absq
        let ab = field_chip.mul(layouter.namespace(|| "a * b"), a, b)?;
        let absq = field_chip.mul(layouter.namespace(|| "ab * ab"), ab.clone(), ab)?;
        let c = field_chip.mul(layouter.namespace(|| "constant * absq"), constant, absq)?;

        // 将结果作为电路的公开输入进行公开
        field_chip.expose_public(layouter.namespace(|| "expose c"), c, 0)
    }
} }
}

测试电路

我们在 chapter about tools 中提到的 MockProver 和 CircuitLayout 可以派上用场

可以用 halo2::dev::MockProver 来测试一个电路是否正常工作。构造电路的一组 Private/Public input ，这组输入可直接用来计算合法证明，但我们把这组输入传入到 MockProver::run 函数中之后，就能得到一个可用于检验电路中每一条约束是否满足的对象。而且电路验证不过，这个对象还能输出那条不满足的约束

如下代码 , MockProver::run 中只知道 Public input c , 他并不知道 Private 是什么, 但仍可以进行验证

fn main() {
    // 我们电路的行数不能超过 2^k. 因为我们的示例电路很小，我们选择一个较小的值
    let k = 4;

    // 准备好电路的隐私输入和公开输入
    let constant = Fp::from(7);
    let a = Fp::from(2);
    let b = Fp::from(3);
    let c = constant * a.square() * b.square();  // 算出来

    // 用隐私输入来实例化电路
    let circuit = MyCircuit {
        constant,
        a: Value::known(a),
        b: Value::known(b),
    };

    // 将公开输入进行排列。乘法的结果被我们放置在 instance 列的第0行，
    // 所以我们把它放在公开输入的对应位置。
    let mut public_inputs = vec![c];

    // 给定正确的公开输入，我们的电路能验证通过
    let prover = MockProver::run(k, &circuit, vec![public_inputs.clone()]).unwrap();
    assert_eq!(prover.verify(), Ok(()));

    // 如果我们尝试用其他的公开输入(此处是 +1)，证明将失败！
    public_inputs[0] += Fp::one();
    let prover = MockProver::run(k, &circuit, vec![public_inputs]).unwrap();
    assert!(prover.verify().is_err());
}

Code Ref / Full example

You can find the source code for this example here.

cargo run --example simple-example

References:

—– 中文版本 End ——

Simple Example

Let’s start with a simple circuit, to introduce you to the common APIs and how they are used. The circuit will take a public input c, and will prove knowledge of two private inputs $a$ and $b$ such that $a^{2} \cdot b^{2} = c$

Define instructions

Instructions are the boundary between high-level gadgets and the low-level circuit operations. Instructions may be as coarse or as granular as desired, but in practice you want to strike a balance between an instruction being large enough to effectively optimize its implementation, and small enough that it is meaningfully reusable.

For our circuit, we will use three instructions:

Load a private number into the circuit.
Multiply two numbers.
Expose a number as a public input to the circuit. (将一个数设置为电路的公开输入)

We also need a type for a variable representing a number. Instruction interfaces provide associated types for their inputs and outputs, to allow the implementations to represent these in a way that makes the most sense for their optimization goals. 我们还需要一个代表数字的变量的类型。指令接口为其输入和输出提供关联类型，以允许实现以对其优化目标最有意义的方式表示这些类型

#![allow(unused)]
fn main() {
trait NumericInstructions<F: Field>: Chip<F> {
    /// Variable representing a number. 用于表示一个数的变量
    type Num;

    /// Loads a number into the circuit as a private input. 隐私输入
    fn load_private(&self, layouter: impl Layouter<F>, a: Value<F>) -> Result<Self::Num, Error>;

    /// Loads a number into the circuit as a fixed constant.
    fn load_constant(&self, layouter: impl Layouter<F>, constant: F) -> Result<Self::Num, Error>;

    /// Returns `c = a * b`.
    fn mul(
        &self,
        layouter: impl Layouter<F>,
        a: Self::Num,
        b: Self::Num,
    ) -> Result<Self::Num, Error>;

    /// Exposes a number as a public input to the circuit.
    /// 将一个数置为电路的公开输入
    fn expose_public(
        &self,
        layouter: impl Layouter<F>,
        num: Self::Num,
        row: usize,
    ) -> Result<(), Error>;
}
}

Among them,

Num is used to adapt to the type handled in this interface, (适配该接口中处理的类型)
load_private is used to load witness,
load_constant is used to load constants,
mul is used to calculate the multiplication of two numbers, and
expose_public is used to set instance.

Define a chip implementation

定义芯片的实现 : For our circuit, we will build a chip that provides the above numeric instructions for a finite field.

If you want to develop a custom chip, you need to implement the chip trait of Halo 2.

Most of the time, using Halo 2 for circuit development does not need to define instructions and chips by oneself. But if you need to use complex ones that Halo 2 does not provide, you need to implement them yourself, such as implementing an emerging(新兴的) cryptographic algorithm.

#![allow(unused)]
fn main() {
/// 这块芯片将实现我们的指令集！芯片存储它们自己的配置，
struct FieldChip<F: Field> {
    config: FieldConfig,
    _marker: PhantomData<F>,
}
}

Every chip needs to implement the Chip trait. This defines the properties of the chip that a Layouter may rely on when synthesizing a circuit, as well as enabling any initial state that the chip requires to be loaded into the circuit. 每一个“芯片“类型都要实现 Chip trait , Chip trait 定义了 Layouter 在 synthesizing 电路时可能需要的关于电路的某些属性，以及若将该芯片加载到电路所需要设置的任何初始状态

synthesizing 电路 : 一般指的是类似 R1CS 那种写约束的意思

#![allow(unused)]
fn main() {
impl<F: FieldExt> Chip<F> for FieldChip<F> {
    type Config = FieldConfig;
    type Loaded = ();

    fn config(&self) -> &Self::Config {
        &self.config
    }

    fn loaded(&self) -> &Self::Loaded {
        &()
    }
}
}

Configure the chip

The chip needs to be configured with the columns, permutations, and gates that will be required to implement all of the desired instructions. (需要为芯片配置好实现我们想要的功能所需要的那些列、置换、门) :

#![allow(unused)]
fn main() {
/// 芯片的状态被存储在一个 config 结构体中，它是在配置过程中由芯片生成，
/// 并且存储在芯片内部。
#[derive(Clone, Debug)]
struct FieldConfig {
    /// 对于这块芯片，我们将用到两个 advice 列来实现我们的指令集。
    /// 它们也是我们与电路的其他部分通信所需要用到列。
    advice: [Column<Advice>; 2],
    instance: Column<Instance>, //公开输入（instance）列

    // 我们需要一个 selector 来激活乘法门，从而在用不到`NumericInstructions::mul`指令的
    //cells 上不设置任何约束。这非常重要，尤其在构建更大型的电路的情况下，列会被多条指令集用到
    s_mul: Selector,

    /// 用来加载常数的 fixed 列
    constant: Column<Fixed>,
}

下面我们来构建约束 :

the most critical functions configure and enable_equality are used to check the equality of the incoming parameters(传入的参数).
如下图 : 在 create_gate 函数中 :
- 乘数 $(a, b)$ 分别在同一行的 $a_{0}, a_{1}$ advice 列 ;
- 乘积 $(o u t)$ 和 $a$ 同在 $a_{0}$ 列, $o u t$ 在 $a$ 的下一行 :
可以看到在代码中, 都是使用相对位置来描述的 !

#![allow(unused)]
fn main() {
// | a0  | a1  | s_mul |
// |-----|-----|-------|
// | lhs | rhs | s_mul |
// | out |     |       |
let lhs = meta.query_advice(advice[0], Rotation::cur());
let rhs = meta.query_advice(advice[1], Rotation::cur());
let out = meta.query_advice(advice[0], Rotation::next()); // Attention !!
}

最后函数返回多项式约束：

若 s_mul 不为 0，则激活校验乘法约束 :
- 当 s_mul * (lhs * rhs - out) == 0，则 lhs * rhs = out 约束成立；
- 当 s_mul * (lhs * rhs - out) != 0， lhs * rhs = out 约束不成立；程序报错
若 s_mul 为 0，则不会激活检查乘法约束，any subsequent values are fine

#![allow(unused)]
fn main() {
impl<F: FieldExt> FieldChip<F> {
    fn construct(config: <Self as Chip<F>>::Config) -> Self {
        Self {
            config,
            _marker: PhantomData,
        }
    }

    fn configure(
        meta: &mut ConstraintSystem<F>,
        advice: [Column<Advice>; 2],
        instance: Column<Instance>,
        constant: Column<Fixed>,
    ) -> <Self as Chip<F>>::Config {
        meta.enable_equality(instance.into());
        meta.enable_constant(constant);
        for column in &advice {
            meta.enable_equality((*column).into());
        }
        let s_mul = meta.selector();

        // 定义我们的乘法门
        meta.create_gate("mul", |meta| {
            // To implement multiplication, we need 3 advice `cells`
            // and 1 selector.  We arrange them like so:
            //
            // | a0  | a1  | s_mul |
            // |-----|-----|-------|
            // | lhs | rhs | s_mul |
            // | out |     |       |
            //
            // 门可以用任一相对偏移，但每一个不同的偏移都会对证明增加开销。
            // 最常见的偏移值是 0 (当前行), 1(下一行), -1(上一行)。
            // 针对这三种情况，有特定的构造函数来构造`Rotation` 结构。
            let lhs = meta.query_advice(advice[0], Rotation::cur());
            let rhs = meta.query_advice(advice[1], Rotation::cur());
            let out = meta.query_advice(advice[0], Rotation::next());
            let s_mul = meta.query_selector(s_mul);

            // 最终，我们将约束门的多项式表达式返回。
            // 对于我们的乘法门，我们仅需要一个多项式约束。
            //
            // `create_gate` 函数返回的多项式表达式，在证明系统中一定等于0。
            // 我们的表达式有以下性质：
            // - 当 s_mul = 0 时，lhs, rhs, out 可以是任意值。
            // - 当 s_mul != 0 时，lhs, rhs, out 将满足 lhs * rhs = out 这条约束。
            vec![s_mul * (lhs * rhs - out)]
        });

        FieldConfig {
            advice,
            instance,
            s_mul,
            constant,
        }
    }
}
}
}

Implement chip Traits

The instructions interface we defined earlier needs to be implemented, and defining the implementation of Number is to encapsulate(封装) finite field elements.

It should be noted that, in addition to row and column, the position of the cell can also be determined by the relative position offset (除了行和列之外，单元的位置还可以通过相对位置偏移来确定).

Generally, there are 3 types of offsets, 0 representing the current position, 1 representing the next position, and -1 representing the previous position.

#![allow(unused)]
fn main() {
/// A variable representing a number.
#[derive(Clone)]
struct Number<F: Field>(AssignedCell<F, F>);

impl<F: Field> NumericInstructions<F> for FieldChip<F> {
    type Num = Number<F>;
    fn load_private(
        &self,
        mut layouter: impl Layouter<F>,
        value: Value<F>,
    ) -> Result<Self::Num, Error> {
        let config = self.config();

        layouter.assign_region(
            || "load private",
            |mut region| {
                region
                    .assign_advice(|| "private input", config.advice[0], 0, || value)
                    .map(Number)
            },
        )
    }

    fn load_constant(
        &self,
        mut layouter: impl Layouter<F>,
        constant: F,
    ) -> Result<Self::Num, Error> {
        let config = self.config();

        layouter.assign_region(
            || "load constant",
            |mut region| {
                region
                    .assign_advice_from_constant(|| "constant value", config.advice[0], 0, constant)
                    .map(Number)
            },
        )
    }

	fn mul(
		&self,
		mut layouter: impl Layouter<F>,
		a: Self::Num,
		b: Self::Num,
	) -> Result<Self::Num, Error> {
		let config = self.config();

		layouter.assign_region(
			|| "mul",
			|mut region: Region<'_, F>| {
				// We only want to use a single multiplication gate in this region,
				// so we enable it at region offset 0; this means it will constrain
				// cells at offsets 0 and 1.
				config.s_mul.enable(&mut region, 0)?;

				// The inputs we've been given could be located anywhere in the circuit,
				// but we can only rely on relative offsets inside this region. So we
				// assign new cells inside the region and constrain them to have the
				// same values as the inputs.
				a.0.copy_advice(|| "lhs", &mut region, config.advice[0], 0)?;
				b.0.copy_advice(|| "rhs", &mut region, config.advice[1], 0)?;

				// Now we can assign the multiplication result, which is to be assigned
				// into the output position.
				let value = a.0.value().copied() * b.0.value();

				// Finally, we do the assignment to the output, returning a
				// variable to be used in another part of the circuit.
				region
					.assign_advice(|| "lhs * rhs", config.advice[0], 1, || value)
					.map(Number)
			},
		)
	}
}

Build the Circuit

既然我们已经有了所需要的指令，以及一块实现了这些指令的芯片，我们终于可以构造示例电路啦

The circuit trait is the entrance to the circuit development. We need to define our own circuit structure and access the witness input.

struct MyCircuit :

在这个结构体中，我们保存隐私输入变量。我们使用 Option<F> 类型是因为，在生成密钥阶段，他们不需要有任何的值。在证明阶段中，如果它们任一为 None 的话，将得到一个错误。

In fact, it can satisfy most scenarios by simply implementing the circuit trait for general circuit development. Some common functions of the chip have already been implemented in Halo 2.

#![allow(unused)]
fn main() {
struct MyCircuit<F: FieldExt> {
    constant: F,
    a: Option<F>,
    b: Option<F>,
}

impl<F: FieldExt> Circuit<F> for MyCircuit<F> {
    // 因为我们在任一地方值用了一个芯片，所以我们可以重用它的配置。
    type Config = FieldConfig;
    type FloorPlanner = SimpleFloorPlanner;

    fn without_witnesses(&self) -> Self {
        Self::default()
    }

    fn configure(meta: &mut ConstraintSystem<F>) -> Self::Config {
        // 我们创建两个 advice 列，作为 FieldChip 的输入。
        let advice = [meta.advice_column(), meta.advice_column()];

        // 我们还需要一个 instance 列来存储公开输入。
        let instance = meta.instance_column();

        // 创建一个 fixed 列来加载常数
        let constant = meta.fixed_column();

        FieldChip::configure(meta, advice, instance, constant)
    }
    // Prove a2⋅b2 = c
    fn synthesize(
        &self,
        config: Self::Config,
        mut layouter: impl Layouter<F>,
    ) -> Result<(), Error> {
        let field_chip = FieldChip::<F>::construct(config);

        // 将我们的隐私值加载到电路中。
        let a = field_chip.load_private(layouter.namespace(|| "load a"), self.a)?;
        let b = field_chip.load_private(layouter.namespace(|| "load b"), self.b)?;

        // 将常数因子加载到电路中
        let constant =
            field_chip.load_constant(layouter.namespace(|| "load constant"), self.constant)?;

        // 我们仅有乘法可用，因此我们按以下方法实现电路：
        //     asq  = a*a
        //     bsq  = b*b
        //     absq = asq*bsq
        //     c    = constant*asq*bsq
        //
        // 但是，按下面的方法实现，更加高效:
        //     ab   = a*b
        //     absq = ab^2
        //     c    = constant*absq
        let ab = field_chip.mul(layouter.namespace(|| "a * b"), a, b)?;
        let absq = field_chip.mul(layouter.namespace(|| "ab * ab"), ab.clone(), ab)?;
        let c = field_chip.mul(layouter.namespace(|| "constant * absq"), constant, absq)?;

        // 将结果作为电路的公开输入进行公开
        field_chip.expose_public(layouter.namespace(|| "expose c"), c, 0)
    }
} }
}

Testing the circuit

The MockProver and CircuitLayout that we mentioned in the chapter about tools can come in handy (派上用场).

如下代码 , MockProver::run 中只知道 Public input c , 他并不知道 Private 是什么, 但仍可以进行验证

fn main() {
    // 我们电路的行数不能超过 2^k. 因为我们的示例电路很小，我们选择一个较小的值
    let k = 4;

    // 准备好电路的隐私输入和公开输入
    let constant = Fp::from(7);
    let a = Fp::from(2);
    let b = Fp::from(3);
    let c = constant * a.square() * b.square();  // 算出来

    // 用隐私输入来实例化电路
    let circuit = MyCircuit {
        constant,
        a: Value::known(a),
        b: Value::known(b),
    };

    // 将公开输入进行排列。乘法的结果被我们放置在 instance 列的第0行，
    // 所以我们把它放在公开输入的对应位置。
    let mut public_inputs = vec![c];

    // 给定正确的公开输入，我们的电路能验证通过
    let prover = MockProver::run(k, &circuit, vec![public_inputs.clone()]).unwrap();
    assert_eq!(prover.verify(), Ok(()));

    // 如果我们尝试用其他的公开输入(此处是 +1)，证明将失败！
    public_inputs[0] += Fp::one();
    let prover = MockProver::run(k, &circuit, vec![public_inputs]).unwrap();
    assert!(prover.verify().is_err());
}

Code Ref / Full example

You can find the source code for this example here.

cargo run --example simple-example

—– 问题 Question —–

这意味着它将对 offsets 0 and 1 处的 2 个 cells 都进行约束(为啥？)

#![allow(unused)]
fn main() {
config.s_mul.enable(&mut region, 0)?;
}

奇怪的一点是，在 fn mul() 函数中，既然已经使用了参数 a: Self::Num, b: Self::Num, 设置了 lhs Cell 和 rhs Cell，那么 a.cell 和 lhs、 b.cell 和 rhs 肯定就是相等的，为什么还要再 region.constrain_equal 约束一次呢？这个约束看起来是多余的且没有必要的？

#![allow(unused)]
fn main() {
// 在此 region 中，我们只想用一个乘法门，所以我们在 region offset=0 处激活它；
// 这意味着它将对 offsets 0 and 1 处的 2 个 cells 都进行约束(为啥？)
config.s_mul.enable(&mut region, 0)?;

// 给我们的输入有可能在电路的任一位置，但在当前 region 中，我们仅可以用
// 相对偏移。所以，我们在 region 内分配新的 cells 并限定他们的值与输入 cells 的值相等。
let lhs = region.assign_advice(
	|| "lhs",
	config.advice[0], // 第 0 列 (advice 列)
	0,                // 第 0 行
	|| a.value.ok_or(Error::SynthesisError), // 放 a 的值进去
)?;
let rhs = region.assign_advice(
	|| "rhs",
	config.advice[1], // 第 1 列,
	0,                // 第 0 行
	|| b.value.ok_or(Error::SynthesisError),
)?;
region.constrain_equal(a.cell, lhs)?;
region.constrain_equal(b.cell, rhs)?;
}

GPT：

虽然 lhs 和 rhs 的值被设置为 a.value 和 b.value，但是这并不意味着它们在电路中是相等的。在电路的布局中，a.cell 和 b.cell 可能已经在其他位置被（意外地）赋值和约束过了。而在这个新的区域（region）中，为了进行乘法操作，你需要确保新分配的 lhs 和 rhs cells 与原始的 a.cell 和 b.cell 相等

这就是为什么 region.constrain_equal 是必要的：它确保了在这个区域（region）中的计算使用了正确的输入值

你可以将其视为一个安全性保障。如果没有这个约束，有可能会有其他的值进入这个区域，并可能导致电路生成错误的结果。通过加入这个约束，你确保了乘法操作是在正确的值上进行的。

目前的 halo2_proofs，一般直接使用 copy_advice：

#![allow(unused)]

fn main() {
}

author: @Demian

references: https://learn.0xparc.org/materials/halo2

Goal

Given $f (0) = x, f (1) = y$ , we will prove $f (9) = z$

    1, 1, 2, 3, 5, 8, 13, ...

    | elem_1 | elem_2 | sum | q_fib
    --------------------------------
    |    1   |    1   |  2  |   1
    |    1   |    2   |  3  |   1
    |    2   |    3   |  5  |   1
    |        |        |     |   0

    q_fib * (elem_1 + elem_2 - elem_3) = 0

Overview

struct ACell : 是一个 tuple struct ，是对 AssignedCell 封装和抽象

FiboChip ：斐波那契数列”芯片“（本 Application 无需自定义指令集）

FiboConfig ：定义了需要挑选哪些”芯片元件“（advice、selector、instance…）

impl FiboChip：芯片元件的连接排布方式

fn construct()
fn configure() ：门(create_gate)

ACell

#![allow(unused)]
fn main() {
#[derive(Debug, Clone)]
struct ACell<F: FieldExt>(AssignedCell<F, F>);
}

Why ACell ?

封装和抽象：通过使用 ACell，我们为用户提供了一个简化和更直观的接口，使他们可以更容易地与已分配的单元格进行交互，而不必每次都直接处理 AssignedCell
灵活性：将来，如果我们想在 ACell 中添加更多的功能或属性，我们可以这样做而不影响现有的代码
故 : ACell 主要是一个辅助结构体，用于简化与电路中单元格的交互

元素访问 :

#![allow(unused)]
fn main() {
// 因为 `ACell` 是对 `AssignedCell` 的简单包装，
// 所以可以直接使用 `.0` 语法来访问其内部的 `AssignedCell` :  `prev_b.0`
let c_val = prev_b.0.value().copied() + prev_c.0.value();
}

.map(ACell)? 访问 :

具体来说，assign_advice 返回的是 Result<AssignedCell<F, F>, Error>， .map(ACell) 会将其转换为 Result<ACell<F>, Error>
元组结构体本身可以作为函数来调用, 相当于调用一个带有一个参数的构造函数。

#![allow(unused)]
fn main() {
// when call .map() , 我们提供一个函数，将其应用于 Result 内的 Ok 的值（if so）
// 本例中传递的函数是 ACell 的构造函数，所以我们是将 AssignedCell 转换成 ACell
// 对于 tuple struct, 如 `let black = Color(0, 0, 0);`
// therefore  `AssignedCell<F, F>` 本身是一个函数
let a_cell = region
    .assign_advice(|| "a", self.config.advice[0], 0, || a)
    .map(ACell)?;
}

impl FiboChip { …

fn construct
fn configure
fn assign_first_row
fn assign_row
fn expose_public

fn configure()

参数：

meta: 是对约束系统的可变引用，允许我们在其中配置列和约束。
Selector : 用于激活或禁用某些特定约束
meta.query_selector : Query a selector at the current position.
Query an advice column at a relative position : Query an advice column at a relative position

#![allow(unused)]
fn main() {
impl<F: FieldExt> FiboChip<F> {
    // pub fn construct(config: FiboConfig) -> Self 
    pub fn configure(
        meta: &mut ConstraintSystem<F>,
        advice: [Column<Advice>; 3],
        instance: Column<Instance>,
    ) -> FiboConfig {
        let col_a = advice[0]; // 对每个 advice 列进行命名
        let col_b = advice[1];
        let col_c = advice[2];
        let selector = meta.selector();

        meta.enable_equality(col_a);
        meta.enable_equality(col_b);
        meta.enable_equality(col_c);
        meta.enable_equality(instance);

        meta.create_gate("add", |meta| {
            //
            // col_a | col_b | col_c | selector
            //   a      b        c       s
            //
            // Query a selector at the current position.
            let s = meta.query_selector(selector);
            let a = meta.query_advice(col_a, Rotation::cur());
            let b = meta.query_advice(col_b, Rotation::cur());
            let c = meta.query_advice(col_c, Rotation::cur());
            vec![s * (a + b - c)]
        });

        FiboConfig {
            advice: [col_a, col_b, col_c],
            selector,
            instance,
        }
    }
}

fn assign_first_row()

函数作用：为 Fibonacci list 的第一行的前 2 个元素分配值 1 , 返回前 3 个元素 a_cell, b_cell, c_cell

region.assign_advice_from_instance ：从 Instance column (public input) 中取值并赋值给 Advice

#![allow(unused)]
fn main() {
// 在 MockProver::run 中，instance 就是 vec![public_input.clone()]
MockProver::run(k, &circuit, vec![public_input.clone()]).unwrap();
}

region.assign_advice：给 Advice column 赋值，这里特指给斐波那契数列的第 3 个数赋值 f(2) = f(0) + f(1)

#![allow(unused)]
fn main() {
pub fn assign_first_row(
	&self,
	mut layouter: impl Layouter<F>,
) -> Result<(ACell<F>, ACell<F>, ACell<F>), Error> {
	layouter.assign_region(
		|| "first row",
		|mut region| {
			self.config.selector.enable(&mut region, 0)?;

			let a_cell = region.assign_advice_from_instance(
				|| "f(0)",
				self.config.instance,
				0,  // instance column's row 0
				self.config.advice[0],
				0  // offset, advice column's row.
			).map(ACell)?;

			let b_cell = region.assign_advice_from_instance(
				|| "f(1)",
				self.config.instance,
				1, // instance column's row 1
				self.config.advice[1],
				0  // offset, advice column's row.
			).map(ACell)?;

			let c_cell = region.assign_advice(
				|| "f(0)+f(1) i.e. a + b",
				self.config.advice[2],
				0,
				|| a_cell.0.value().copied() + b_cell.0.value()
			).map(ACell)?;

			Ok((a_cell, b_cell, c_cell))
		},
	)
}
}

fn assign_row()

fn assign_row() 函数的作用：不断将上一行的 $a_{1}$ 和 $a_{2}$ Advice 列复制到当前行的 $a_{0}$ 和 $a_{1}$ Advice 列

PS：这是通过 impl Circuit for MyCircuit.. 中的 synthesis() 重复调用实现的：

#![allow(unused)]
fn main() {
fn synthesis() {
    // ...
	for _i in 3..10 {
		let c_cell = chip.assign_row(layouter.namespace(|| "next row"), &prev_b, &prev_c)?;
		prev_b = prev_c;
		prev_c = c_cell;
	}
}

传入参数：

prev_b: &ACell<F>, prev_c: &ACell<F>, ：这正是上一行中的 $a_{1}$ 和 $a_{2}$ Advice 列（第 2/3 Advice 列），这意味着前一个b值被复制到新行的第一列（标记为a），前一个c值被复制到新行的第二列（标记为b）

将 prev_b、prev_c 2 个 Cells copy_advice 到新的 Advice 列后：

计算新的斐波那契数c_val，它是prev_b和prev_c的和。
使用assign_advice分配c_val到新行的第三列，并返回此值的 ACell

#![allow(unused)]
fn main() {
pub fn assign_row(
	&self,  // 当前`FiboChip`实例的引用
	mut layouter: impl Layouter<F>,
	prev_b: &ACell<F>,   // Fibonacci 数列中的上一行的第 2/3 个 Advice Cell
	prev_c: &ACell<F>,
) -> Result<ACell<F>, Error> {
	layouter.assign_region(
		|| "next row",
		|mut region| {
			self.config.selector.enable(&mut region, 0)?;

			prev_b.0.copy_advice(
				|| "a", 
				&mut region, 
				self.config.advice[0], 
				0
			)?;
			prev_c.0.copy_advice(|| "b", &mut region, self.config.advice[1], 0)?;

			let c_val = prev_b.0.value().copied() + prev_c.0.value();

			let c_cell = region
				.assign_advice(|| "c", self.config.advice[2], 0, || c_val)
				.map(ACell)?;

			Ok(c_cell)
		},
	)
}
}

copy_advice vs assign_advice i.e. 复制 vs. 赋值:

当我们说“复制”，我们实际上是说我们要确保一个 Region-Cell 的值与另一个 Region-Cell 中的值是相同的。与其为每个地方重新计算/分配(assign)一个值，不如简单地“复制”该值到新位置，以确保它们是一样的（考虑 PLONK 中的 permutation argument）
Permutations and Copy Constraints: Halo2 使用一种称为“permutation argument“的技术来确保两个或多个单元格中的值是相同的。copy_advice 实际上是在背后使用这个技术，通过引入一个额外的约束来确保值的一致性

fn expose_public()

expose_public 函数作用：将指定的 ACell 公开为 Public Input

#![allow(unused)]
fn main() {
fn synthesis() {
    // ...
    // 将最后一个值公开为 public input
    chip.expose_public(layouter.namespace(|| "out"), &prev_c, 2)?;
}
}

#![allow(unused)]
fn main() {
pub fn expose_public(
	&self,
	mut layouter: impl Layouter<F>,
	cell: &ACell<F>,
	row: usize,
) -> Result<(), Error> {
	layouter.constrain_instance(cell.0.cell(), self.config.instance, row)
}
}

MyCircuit

let chip = FiboChip::construct(config); : 传入 config 创建一个新的 FiboChip 实例
chip.assign_first_row(layouter.namespace(|| "first row"), self.a, self.b)?; : 初始化斐波那契数列: 调用 assign_first_row 函数以在第一行中设置斐波那契数列的前两个值 self.a 和 self.b。返回的结果是三个值：prev_a, prev_b 和 prev_c。其中，prev_c 是前两个数的和
chip.expose_public(layouter.namespace(|| "private a"), &prev_a, 0)?; : 公开前两个数: 将前两个数 expose 为 public, 这意味着这些值可以被 $V er i f i er$ 访问和验证
计算后续的斐波那契数: for 循环中，assign_row 函数被调用以计算后续的斐波那契数。每次迭代都会生成新的斐波那契数并为下一次迭代更新 prev_b 和 prev_c
chip.expose_public(layouter.namespace(|| "out"), &prev_c, 2)?; : 公开最终的斐波那契数: 将循环结束后的最后一个斐波那契数值设为 Public

#![allow(unused)]
fn main() {
#[derive(Default)]
struct MyCircuit<F> (PhantomData<F>);

impl<F: PrimeField> Circuit<F> for MyCircuit<F> {
    type Config = FiboConfig;
    type FloorPlanner = SimpleFloorPlanner;

    fn without_witnesses(&self) -> Self {
        Self::default()
    }

    fn configure(meta: &mut ConstraintSystem<F>) -> Self::Config {
        let col_a = meta.advice_column();
        let col_b = meta.advice_column();
        let col_c = meta.advice_column();
        let instance = meta.instance_column();
        FiboChip::configure(meta, [col_a, col_b, col_c], instance)
    }
}
}

fn synthesis()

这个函数定义了在 MyCircuit 电路中如何放置约束和分配单元格 Cell，它构建了一个斐波那契序列，并确保输出正确。

#![allow(unused)]
fn main() {
fn synthesize(
	&self,
	config: Self::Config,
	mut layouter: impl Layouter<F>,
) -> Result<(), Error> {
	let chip = FiboChip::construct(config);

	let (_, mut prev_b, mut prev_c) =
		chip.assign_first_row(layouter.namespace(|| "first row"))?;
	
	// 这是干啥??
	// chip.expose_public(layouter.namespace(|| "private a"), &prev_a, 0)?;
	// chip.expose_public(layouter.namespace(|| "private b"), &prev_b, 1)?;

	for _i in 3..10 {
		let c_cell = chip.assign_row(layouter.namespace(|| "next row"), &prev_b, &prev_c)?;
		prev_b = prev_c;
		prev_c = c_cell;
	}

	chip.expose_public(layouter.namespace(|| "out"), &prev_c, 2)?;

	Ok(())
}
}

Test

#![allow(unused)]
fn main() {
#[cfg(test)]
mod tests {
    use super::MyCircuit;
    use halo2_proofs::{circuit::Value, dev::MockProver, pasta::Fp};
    use std::marker::PhantomData;

    #[test]
    fn test_example1() {
        let k = 4;

        let a = Fp::from(1); // F[0]
        let b = Fp::from(1); // F[1]
        let out = Fp::from(55); // F[9]

        let circuit = MyCircuit(PhantomData);

        let mut public_input = vec![a, b, out];

        let prover = MockProver::run(k, &circuit, vec![public_input.clone()]).unwrap();
        prover.assert_satisfied();

        public_input[2] += Fp::one(); // out += 2  =>  unsatisfied
        let _prover = MockProver::run(k, &circuit, vec![public_input]).unwrap();
        // uncomment the following line and the assert will fail
        // _prover.assert_satisfied();
    }
}

Usage

cargo test -- --nocapture fibonacci::example1

# Draw
cargo test --release --all-features plot_fibo1

the white column is the instance column,
the pink one is the advice and
the purple one is the selector.
the green part shows the cells that have been assigned
- light green : selector not used.

Reference :

question

… No Question?

author: @Demian

references: https://learn.0xparc.org/materials/halo2

Fibonacci Example 2

回顾 Example-1 里的 Table：

在 example-1 中有一些问题：

重复单元格太多，每次需要将 2 个单元格从上一行复制到下一行，效率不高
更好的解决方案：使用 Rotation 来访问多行是个更好的方案

如下图：

Overview

在本例子中, 代码将更加紧凑和模块化, 以下是一些主要的区别 :

Advice Columns:

ex 1 :
- 用了 3 个 advice columns：col_a, col_b 和 col_c，表的的第一行用来存储 Fibonacci 序列的连续的 3 个数
ex 2:
- 仅使用了一个 advice column，并依赖 Rotation（轮转, 即 $ro w$ ）来访问连续的行，减少了各种复制

#![allow(unused)]
fn main() {
// example-1
pub fn configure(.., advice: [Column<Advice>; 3], ..) {
    let col_i = advice[ii];	
    meta.enable_equality(col_i); // 很多列需要声明 和 需要 enable...

    meta.create_gate("add", |meta| {
        let s = meta.query_selector(selector);
        let a = meta.query_advice(col_a, Rotation::cur()); //📢
        let b = meta.query_advice(col_b, Rotation::cur()); //📢
        let c = meta.query_advice(col_c, Rotation::cur()); //📢
    vec![s * (a + b - c)]
}

----------------------------------------

// example-2
pub fn configure(.., advice: Column<Advice>, ..) {
    let col_i = advice[ii];	
	meta.enable_equality(advice);
	meta.enable_equality(instance);

	// Gen Custom Gate:
	meta.create_gate("add", |meta| {
		//
		// advice | selector
		//   a    |   s
		//   b    |
		//   c    |
		//
		let s = meta.query_selector(selector);
		let a = meta.query_advice(advice, Rotation::cur());
		let b = meta.query_advice(advice, Rotation::next());
		let c = meta.query_advice(advice, Rotation(2));
		vec![s * (a + b - c)]
	});
}

Rotation::cur() 当前行
Rotation::next() 下一行
Rotation(2) 再下一行

The Polynomial Identity: $S (x) \cdot (A (x) + A (ω x) - A (ω^{2} x)) = 0$

数据赋值:

ex 1: 初始的 Fibonacci 数 a 和 b 被赋值到两个不同的 advice columns，而他们的和则被赋值到第三个 column。
ex 2: 所有的 Fibonacci 数都在同一个 advice column，但在不同的行 (thanks to rotation)

#![allow(unused)]
fn main() {
////  Example 2  ////
pub fn assign(
	&self,
	mut layouter: impl Layouter<F>,
	nrows: usize,  // 前 2 列赋值之后, 后面要搞的列数.. 
) -> Result<ACell<F>, Error> {
	layouter.assign_region(
		|| "entire fibonacci table",
		|mut region| {
			// 为前两行启用 selector, 这意味着我们将从 instance (public input) 列中复制 Fibo 序列的前 2 个数字
			self.config.selector.enable(&mut region, 0)?;
			self.config.selector.enable(&mut region, 1)?;
			
			// assign_advice_from_instance 方法，将 instance (public input) 列的前 2 个值
			//   (即 Fibonacci 序列的前两个数字）赋给 advice 列中的前 2 个单元格
			//   后面在 MockProver 中, 我们会传入 instance 作为 Public input
			let mut a_cell = region.assign_advice_from_instance(
				|| "1",
				self.config.instance,
				0,  // instance column's row 0
				self.config.advice,
				0, // 复制到当前的 region 的 row 0
			).map(ACell)?;

			let mut b_cell = region.assign_advice_from_instance(
				|| "1",
				self.config.instance,
				1, // instance column's row 1
				self.config.advice,
				1,  // 复制到当前的 region 的 row 1
			).map(ACell)?;

            /// .....
		},
	)
}
}

生成的 Fibonacci 数:

ex 1: 使用方法 assign_row 从前两个数生成下一个数。
ex 2: 使用一个循环在整个 Fibonacci 表格中为所有的数赋值。

#![allow(unused)]
fn main() {
////  Example 2  ////
pub fn assign(..., nrows){

    /// .....

	// 赋值好了前 2 行(递归基), 其余的行就累加过去就好了
	for row in 2..nrows { // 对于最后两行, 不需要启用 Selector
		if row < nrows - 2 {
			self.config.selector.enable(&mut region, row)?;
		}

		let c_cell = region.assign_advice(
			|| "advice",
			self.config.advice,
			row,
			|| a_cell.0.value().copied() + b_cell.0.value(),
		).map(ACell)?;

		a_cell = b_cell; // let mut a_cell ...
		b_cell = c_cell;
	}

	Ok(b_cell) // return the last cell.
}
}

Test

如下 instance , 里面是 Public input

#![allow(unused)]
fn main() {
#[test]
fn test_example2() {
	let k = 4;

	let a = Fp::from(1); // F[0]
	let b = Fp::from(1); // F[1]
	let out = Fp::from(55); // F[9]

	let circuit = MyCircuit(PhantomData);

	let mut public_input = vec![a, b, out];

	let prover = MockProver::run(k, &circuit, vec![public_input.clone()]).unwrap();
	prover.assert_satisfied();

	public_input[2] += Fp::one();
	let _prover = MockProver::run(k, &circuit, vec![public_input]).unwrap();
	// uncomment the following line and the assert will fail
	// _prover.assert_satisfied();
}
}

change k from 13 to 4, the line will be smaller so now you are not calim about the main function

the MockProver will tell you constrains that $f ai l e d$
the png will tell you a $mi ss in g$ constraint you have ignored !

Usage

cargo test -- --nocapture fibonacci::example1

# Draw
cargo test --release --all-features plot_fibo1

the white column is the instance column,
the pink one is the advice and
the purple one is the selector.
the green part shows the cells that have been assigned
- light green : selector not used.

Reference :

Jason Morton

—— 中文版本结束 ——

Example 2

Recap Table in Example-1 ：

the problem we noticed like inside example-1 is that there are basically

too many duplicate cells , so every time you need copy two cells from previous row to next row , not efficient
better solution : Use rotation to access to the multiple rows.

在本例子中, 代码将更加紧凑和模块化, 以下是一些主要的区别 :

Advice Columns:

ex 1 :
- 用了 3 个 advice columns：col_a, col_b 和 col_c，这 3 个 columns 的第一行用来存储 Fibonacci 序列的连续的 3 个数
- configure() 在 3 个 advice columns 中为每一个需启用 enable_equality，并为每一个都建立了门约束。
ex 2:
- 仅使用了一个 advice column，并依赖 rotation（轮转, 即 $ro w$ ）来访问连续的数, 减少了各种复制

#![allow(unused)]
fn main() {
// example-1
pub fn configure(
	.., advice: [Column<Advice>; 3], .. 
	{
    let col_i = advice[ii];	
    meta.enable_equality(col_i); // 很多列需要声明, 需要 enable...

    meta.create_gate("add", |meta| {
        let s = meta.query_selector(selector);
        let a = meta.query_advice(col_a, Rotation::cur()); //📢
        let b = meta.query_advice(col_b, Rotation::cur()); //📢
        let c = meta.query_advice(col_c, Rotation::cur()); //📢

}

----------------------------------------

// example-2
pub fn configure(  
	.., advice: Column<Advice>, .. 
	{
    meta.enable_equality(advice); //所有 advice 列只在此 enable once.

    meta.create_gate("add", |meta| {
        let s = meta.query_selector(selector);
        let a = meta.query_advice(advice, Rotation::cur()); //💡
        let b = meta.query_advice(advice, Rotation::next());//💡
        let c = meta.query_advice(advice, Rotation(2));}    //💡
}

Rotation::cur() 当前行
Rotation::next() 下一行
Rotation(2) 再下一行

The Polynomial Identity : $S (x) \cdot (A (x) + A (ω x) - A (ω^{2} x)) = 0$

数据赋值:
- ex 1: 初始的 Fibonacci 数 a 和 b 被赋值到两个不同的 advice columns，而他们的和则被赋值到第三个 column。
- ex 2: 所有的 Fibonacci 数都在同一个 advice column，但在不同的行 (thanks to rotation)

#![allow(unused)]
fn main() {
////  Example 2  ////
pub fn assign(..., nrows){
  layouter.assign_region("entire fibonacci table",
    |mut region| {
    // 为前两行启用 selector,这意味着我们将从 instance 列（可能是公共输入）
    // 中复制 Fibonacci 序列的前 2 个数字
    self.config.selector.enable(&mut region, 0)?;
    self.config.selector.enable(&mut region, 1)?;

    // assign_advice_from_instance 方法，将 instance 列的前两个值
	//   (即 Fibonacci 序列的前两个数字）赋给 advice 列中的前两个单元格
	//   后面在 MockProver 中, 我们会传入 instance 作为 Public input
	let mut a_cell = region.assign_advice_from_instance(
		|| "1",
		self.config.instance,
		0,
		self.config.advice,
		0,  // row
	)?;
	let mut b_cell = region.assign_advice_from_instance(
		|| "1",
		self.config.instance,
		1,  // 这里写 0 也不报错, 写 1/2/3 就会报错了..
		self.config.advice,
		1,  // row
    )?;
    
	// 赋值好了前 2 行(递归基) ,其余的行就累加过去就好了
	for row in 2..nrows {
		if row < nrows - 2 {
			self.config.selector.enable(&mut region, row)?;
		}

		let c_cell = region.assign_advice(
			|| "advice",
			self.config.advice,
			row,
			|| a_cell.value().copied() + b_cell.value(),
		)?;

		a_cell = b_cell;
		b_cell = c_cell;
	}

	Ok(b_cell)	
}
}

生成的 Fibonacci 数:
- Version 1: 使用方法 assign_row 从前两个数生成下一个数。
- Version 2: 使用一个循环在整个 Fibonacci 表格中为所有的数赋值。

#![allow(unused)]
fn main() {
////  Example 2  ////
pub fn assign(..., nrows){
	// 赋值好了前 2 行(递归基) ,其余的行就累加过去就好了
	for row in 2..nrows {
		if row < nrows - 2 {
			self.config.selector.enable(&mut region, row)?;
		}

		let c_cell = region.assign_advice(
			|| "advice",
			self.config.advice,
			row,
			|| a_cell.value().copied() + b_cell.value(),
		)?;

		a_cell = b_cell;
		b_cell = c_cell;
	}

	Ok(b_cell)
}
}

如下 instance , 里面是 Public input

#![allow(unused)]
fn main() {
#[test]
fn test_example2() {
	let k = 4;

	let a = Fp::from(1); // F[0]
	let b = Fp::from(1); // F[1]
	let out = Fp::from(55); // F[9]

	let circuit = MyCircuit(PhantomData);

	let mut public_input = vec![a, b, out];

	let prover = MockProver::run(k, &circuit, vec![public_input.clone()]).unwrap();
	prover.assert_satisfied();

	public_input[2] += Fp::one();
	let _prover = MockProver::run(k, &circuit, vec![public_input]).unwrap();
	// uncomment the following line and the assert will fail
	// _prover.assert_satisfied();
}
}

print

the white column is the instance column,
the pink one is the advice and
the purple one is the selector.
the green part shows the cells that have been assigned
- light green : selector not used.

cargo test --all-features -- --nocapture print

change k from 13 to 4, the line will be more small so now you are not calim about the main function .

the MockProver will tell you constrains that $f ai l e d$ ,
the png will tell you a $mi ss in g$ constraint you have ignored !

Row & Column in Region

Compared example-1 with example-2 :

#![allow(unused)]
fn main() {
meta.create_gate("add", |meta| {
	// col_a | col_b | col_c | selector
	//   a      b        c       s
	let s = meta.query_selector(selector);
	let a = meta.query_advice(col_a, Rotation::cur());
	let b = meta.query_advice(col_b, Rotation::cur());
	let c = meta.query_advice(col_c, Rotation::cur());
	vec![s * (a + b - c)]

---------------------------------------------

meta.create_gate("add", |meta| {
	// advice | selector
	//   a    |   s
	//   b    |
	//   c    |
	let s = meta.query_selector(selector);
	let a = meta.query_advice(advice, Rotation::cur());
	let b = meta.query_advice(advice, Rotation::next());
	let c = meta.query_advice(advice, Rotation(2));
	vec![s * (a + b - c)] 
}

We see :

col_a / col_b / col_c represent different $co l u mn s$
Rotation::cur() / Rotation::next() / Rotation::prev() / Rotation(2) represent different $ro w s$

cargo test -- --nocapture fibonacci::example2

References :

author: @Demian

references: https://learn.0xparc.org/materials/halo2

Goal
Overview
Iszero Chip
- structs
- impl IsZeroChip { ..
Example 3
- configure
- assign
- test
usage
References:

Goal

We want Prove that : f(a, b, c) = if a == b {c} else {a - b}

证明某人知道三个数字 a、b 和 c，使得当 a == b 时，输出为 c，否则输出为 a - b，而无需揭示a、b 和 c 的实际值。

how to describe it ? Firstly, let’s dive into the Iszero Chip

这一部分主要展示了如何复用另外一个电路来辅助电路设计

Overview

$ tree
├── fibonacci
│   └── example3.rs
├── is_zero.rs

Iszero Chip

structs

#![allow(unused)]
fn main() {
#[derive(Clone, Debug)]
pub struct IsZeroConfig<F> {
    pub value_inv: Column<Advice>,
    pub is_zero_expr: Expression<F>,
}

impl<F: FieldExt> IsZeroConfig<F> {
    pub fn expr(&self) -> Expression<F> {
        self.is_zero_expr.clone()
    }
}

pub struct IsZeroChip<F: FieldExt> {
    config: IsZeroConfig<F>,
}
}

impl IsZeroChip { ..

configure

传入参数：

q_enable, value 都接收一个闭包，将执行的时机和执行的具体内容进行解耦。也就是说，configure 方法可以决定何时执行 value，而调用者可以决定执行 value 时应该做什么
闭包可以捕获其环境，这意味着每次传入不同的闭包，configure 函数的行为都可能不同。这为函数调用者提供了更大的灵活性。

注意 AssignedCell 和 VirtualCells 的区别（读下 Source code）

#![allow(unused)]
fn main() {
impl<F: FieldExt> IsZeroChip<F> {
    pub fn construct(config: IsZeroConfig<F>) -> Self {
        IsZeroChip { config }
    }

    pub fn configure(
        meta: &mut ConstraintSystem<F>,
        q_enable: impl FnOnce(&mut VirtualCells<'_, F>) -> Expression<F>,
        value: impl FnOnce(&mut VirtualCells<'_, F>) -> Expression<F>,
        value_inv: Column<Advice>,
    ) -> IsZeroConfig<F> {
        let mut is_zero_expr = Expression::Constant(F::zero());

        meta.create_gate("is_zero", |meta| {
            //
            // valid | val |  val_inv |  1 - val * val_inv | val * (1 - val * val_inv)
            // ------+-----+----------+--------------------+-------------------
            //  yes  |  x  |    1/x   |        0           |   0
            //  no   |  x  |    0     |        1           |   x
            //  yes  |  0  |    0     |        1           |   0
            //  yes  |  0  |    y     |        1           |   0

            //
            let value = value(meta);
            let q_enable = q_enable(meta);
            let value_inv = meta.query_advice(value_inv, Rotation::cur());

            is_zero_expr = Expression::Constant(F::one()) - value.clone() * value_inv;
            vec![q_enable * value * is_zero_expr.clone()]  // gate's constraints
        });

        IsZeroConfig {
            value_inv,
            is_zero_expr,
        }
    }
}

configure defines the logic for the “is-zero” gate. It uses the following table to guide the logic:

valid | val |  val_inv |  1 - val * val_inv | val * (1 - val * val_inv)
------+-----+----------+--------------------+-------------------       
 yes  |  x  |    1/x   |        0           |   0                      
 no   |  x  |    0     |        1           |   x                      
 yes  |  0  |    0     |        1           |   0                      
 yes  |  0  |    y     |        1           |   0

第 1 / 3 / 4 行涉及到的约束不需要通过 q_enable 即可完成, 但是考虑第二行所涉及到的情况 :

如果 $P$ 是个 malicious Prover, 他提供了 val == x 和 val_inv == 0 , 此时仅靠 is_zero_expr 是无法分辨的 (这个 case 里 assign 函数会直接分配 self.config.value_inv i.e. $0$ 即认为这个值是 $0$
但是添加了 vec![q_enable * value * is_zero_expr.clone()] 约束就不一样了 , 约束强制要求 val * is_zero_expr i.e. val * ( 1 - val * val_inv) 必须为 0 , 从而解决了这种 malicious situation
如果 malicious $P$ 提供了这种 Witness, 将不会通过约束校验, 也就不会生成该 proof
只有 $P$ 提供了符合约束的 Witness, val_inv 才会被赋值给 val_inv column

The gate ensures that for valid rows:

If the $v a l u e \neq = 0$ , its inverse is computed such that their multiplication (val * val_inv) ’s results in 1.
If the $v a l u e == 0$ , its inverse can be any value, but the result of their multiplication should be 0.

The gate equation is q_enable * value * (1 - value * value_inv), which should be satisfied for the valid conditions.

assign(): This method is used to assign the inverse of a value (if it exists) or zero to the specified advice column in the circuit.

#![allow(unused)]
fn main() {
is_zero_expr = Expression::Constant(F::one()) - value.clone() * value_inv;
}

i.e. 1 - val * val_inv , like the table above :
- if val != 0 : is_zero_expr = 0
- if val == 0 : is_zero_expr = 1

vec![q_enable * value * is_zero_expr.clone()] is the gate’s constraint. it should be $0$

assign

#![allow(unused)]
fn main() {
pub fn assign(
	&self,
	region: &mut Region<'_, F>,
	offset: usize,
	value: Value<F>,
) -> Result<(), Error> {
	// value.invert()  OR  F::zero()
	let value_inv = value.map(|value| value.invert().unwrap_or(F::zero()));
	region.assign_advice(|| "value inv", self.config.value_inv, offset, || value_inv)?;
	Ok(())
}
}

在 IsZero 的验证过程中，将要验证的值（或输入值）分配到电路区域中，以便在电路中进行计算和约束的验证 :

如果要验证的值为零，assign 方法将为逆元分配一个特定的值（例如 F::zero()）
如果要验证的值不为零，value_inv columns 将被分配为 value.invert().unwrap_or(F::zero()) i.e. value.invert()

这些 IsZero 的 check 将被赋值到 value_inv column 并在其上得到体现

Example 3

welcome back, now we have the gadget IsZero , so we can constrain malicious $P$ ’s input

#![allow(unused)]
fn main() {
#[derive(Debug, Clone)]
struct FunctionConfig<F: FieldExt> {
    selector: Selector,
    a: Column<Advice>,
    b: Column<Advice>,
    c: Column<Advice>,
    a_equals_b: IsZeroConfig<F>,
    output: Column<Advice>,
}
#[derive(Debug, Clone)]
struct FunctionChip<F: FieldExt> {
    config: FunctionConfig<F>,
}
}

configure

Recap : f(a, b, c) = if a == b {c} else {a - b}

column : 除了常规的 a/b/c advice column, 还申请了 is_zero_advice_column
IsZeroChip : use crate::is_zero::{IsZeroChip, IsZeroConfig}; 使用了上面定义的 IsZero chip 来校验 $a == b$ 这个事情 (因为 a/b 都是 $P$ 提供的, 一个 malicious $P$ 有动机去提供 a=3 , b=4 然后 return c , 必须通过生成 proof 前的约束来限制 $P$ 的行为)
IsZeroChip::configure 返回 IsZeroConfig<F>

#![allow(unused)]
fn main() {
impl<F: FieldExt> FunctionChip<F> {
    pub fn construct(config: FunctionConfig<F>) -> Self { Self { config } }

    pub fn configure(meta: &mut ConstraintSystem<F>) -> FunctionConfig<F> {
        let selector = meta.selector();
        let a = meta.advice_column();
        let b = meta.advice_column();
        let c = meta.advice_column();
        let output = meta.advice_column();

        let is_zero_advice_column = meta.advice_column();
        
        let a_equals_b = IsZeroChip::configure(
            meta,
            |meta| meta.query_selector(selector),
            |meta| meta.query_advice(a, Rotation::cur()) - meta.query_advice(b, Rotation::cur()),
            is_zero_advice_column,
        );

        meta.create_gate("f(a, b, c) = if a == b {c} else {a - b}", |meta| {
            let s = meta.query_selector(selector);
            let a = meta.query_advice(a, Rotation::cur());
            let b = meta.query_advice(b, Rotation::cur());
            let c = meta.query_advice(c, Rotation::cur());
            let output = meta.query_advice(output, Rotation::cur());
            vec![
                s.clone() * (a_equals_b.expr() * (output.clone() - c)),
                s * (Expression::Constant(F::one()) - a_equals_b.expr()) * (output - (a - b)),
            ]
        });

        FunctionConfig {
            selector,
            a,
            b,
            c,
            a_equals_b,
            output,
        }
    }
}

assign

IsZeroChip::construct : 创建一个IsZeroChip实例
layouter.assign_region( :
1. is_zero_chip.assign(&mut region, 0, Value::known(a - b))?;
2. region.assign_advice(|| "output", self.config.output, 0, || Value::known(output))

#![allow(unused)]
fn main() {
pub fn assign(
  &self,
  mut layouter: impl Layouter<F>,
  a: F,  b: F,  c: F,
) -> Result<AssignedCell<F, F>, Error> {
  let is_zero_chip = IsZeroChip::construct(self.config.a_equals_b.clone());

  layouter.assign_region(
    || "f(a, b, c) = if a == b {c} else {a - b}",
    |mut region| {
      self.config.selector.enable(&mut region, 0)?;
      region.assign_advice(|| "a", self.config.a, 0, || Value::known(a))?;
      region.assign_advice(|| "b", self.config.b, 0, || Value::known(b))?;
      region.assign_advice(|| "c", self.config.c, 0, || Value::known(c))?;

      // 正式使用 IsZeroChip 子电路来检查 a - b 是否为零
      is_zero_chip.assign(&mut region, 0, Value::known(a - b))?;

      // Rust expr to calculate val.
      let output = if a == b { c } else { a - b };
      // assign to cell.
      region.assign_advice(|| "output", self.config.output, 0, || Value::known(output))
    },
  ) }
}

test

#![allow(unused)]
fn main() {
#[cfg(test)]
mod tests {
    use super::*;
    use halo2_proofs::{dev::MockProver, pasta::Fp};

    #[test]
    fn test_example3() {
        let circuit = FunctionCircuit {
            a: Fp::from(10),
            b: Fp::from(12),
            c: Fp::from(15),
        };

        let prover = MockProver::run(4, &circuit, vec![]).unwrap();
        prover.assert_satisfied();
    }
}
}

usage

cargo test -- --nocapture fibonacci::example3

# Draw
cargo test --release --all-features plot_fibo3

the white column is the instance column,
the pink one is the advice and
the purple one is the selector.
the green part shows the cells that have been assigned
- light green : selector not used.

References:

author: @Demian

references: https://learn.0xparc.org/materials/halo2

Goal

证明一个 value 在给定的范围内，但不透露其具体的值（This helper checks that the value witnessed in a given cell is within a given range）。

范围检查在实际应用中是非常重要的，因为它允许证明者证明他们知道一个值（例如，他们的年龄或账户余额）而不实际公开这个值

Overview

Range-check-example-1 用了一个比较朴素的办法：通过计算表达式 (v) * (1 - v) * (2 - v) * ... * (R - 1 - v) 是否为 0，实现了一个用于范围检查的配置 RangeCheckConfig，以及相关的方法。主要特点包括：

使用了一个简单的表达式 (v) * (1 - v) * (2 - v) * ... * (R - 1 - v)来执行范围检查
RangeCheckConfig 配置包含 q_range_check 选择器，用于启用范围检查约束
没有涉及查找表（Lookup Table）
测试中对成功和失败的范围检查进行了验证

struct

#![allow(unused)]
fn main() {
#[derive(Debug, Clone)]
/// A range-constrained value in the circuit produced by the RangeCheckConfig.
struct RangeConstrained<F: FieldExt, const RANGE: usize>(AssignedCell<Assigned<F>, F>);

#[derive(Debug, Clone)]
struct RangeCheckConfig<F: FieldExt, const RANGE: usize> {
    value: Column<Advice>,
    q_range_check: Selector,
    _marker: PhantomData<F>,
}
}

configure

pub fn configure 在 约束系统 中定义自定义门，确保当选择器被激活时值在预期范围内（pub fn configure defines Custom Gates in the constraint system that ensures values are within the expected range when the Selector is activated .）

Define Query Selector 和 advice column:

#![allow(unused)]
fn main() {
let q = meta.query_selector(q_range_check);
let value = meta.query_advice(value, Rotation::cur());
}

定义范围检查表达式:

Closure 为给定的范围和值定义了一个连乘的 Expression，例如对于某个值 v ，范围是计算 (v) * (1 - v) * (2 - v) . If v is indeed in the expected range, The res of multiplication expression will be $0$
用(1..range)来创建一个范围，该范围从 $1$ 开始，到 range 结束（但不包括 range itself ）。然后，我们使用迭代器方法 fold 方法对该范围中的每个值进行迭代 , 其接受 2 个参数 :
- init 初始值：在这里，初始值是 value 的克隆
- mut f ：这个 Closure 定义了如何结合前一个结果和当前元素来生成新的结果。闭包接受两个参数：expr（到目前为止累积的结果）和i（当前元素）

#![allow(unused)]
fn main() {
let range_check = |range: usize, value: Expression<F>| {
  assert!(range > 0);
  (1..range).fold( value.clone(), |expr, i| {
    expr * (Expression::Constant(F::from(i as u64)) - value.clone())
  })  };
}

添加约束:

#![allow(unused)]
fn main() {
// new API
Constraints::with_selector(q, [("range check", range_check(RANGE, value))])
}

当 q_range_check 选择器被激活（即 $q$ 为 1 ）时，这个约束将确保值在预定的范围内

#![allow(unused)]
fn main() {
impl<F: FieldExt, const RANGE: usize> RangeCheckConfig<F, RANGE> {
  pub fn configure(meta: &mut ConstraintSystem<F>, value: Column<Advice>) -> Self {
    let q_range_check = meta.selector();

    meta.create_gate("range check", |meta| {
      //    value   |  q_range_check
      //     ------------------------------
      //      v     |     1

      let q = meta.query_selector(q_range_check);
      let value = meta.query_advice(value, Rotation::cur());

      // Given a range `R` and a value `v`, returns the expression
      // (v) * (1 - v) * (2 - v) * ... * (R - 1 - v)
      let range_check = |range: usize, value: Expression<F>| {
        assert!(range > 0);
        (1..range).fold(value.clone(), |expr, i| {
          expr * (Expression::Constant(F::from(i as u64)) - value.clone())
        })
      };
      // constrain the expr: `range_check(RANGE, value)` is 0.
      Constraints::with_selector(q, [("range check", range_check(RANGE, value))])
    });

    Self {
      q_range_check,
      value,
      _marker: PhantomData,
    }
  }
}

assign

#![allow(unused)]
fn main() {
  pub fn assign(
    &self,
    mut layouter: impl Layouter<F>,
    value: Value<Assigned<F>>,
  ) -> Result<RangeConstrained<F, RANGE>, Error> {
    layouter.assign_region(
      || "Assign value",
      |mut region| {
        let offset = 0;

        // Enable q_range_check
        self.q_range_check.enable(&mut region, offset)?;

        // Assign value
        region
          .assign_advice(|| "value", self.value, offset, || value)
          .map(RangeConstrained) // call tuple struct's construct fun. 调用元组结构体的构造函数.
      },
    )
  }
}

Circuit

#![allow(unused)]
fn main() {
#[derive(Default)]
struct MyCircuit<F: FieldExt, const RANGE: usize> {
	value: Value<Assigned<F>>,
}

impl<F: FieldExt, const RANGE: usize> Circuit<F> for MyCircuit<F, RANGE> {
	type Config = RangeCheckConfig<F, RANGE>;
	type FloorPlanner = V1;

	fn without_witnesses(&self) -> Self {
		Self::default()
	}

	fn configure(meta: &mut ConstraintSystem<F>) -> Self::Config {
		let value = meta.advice_column();
		RangeCheckConfig::configure(meta, value)
	}

	fn synthesize(
		&self,
		config: Self::Config,
		mut layouter: impl Layouter<F>,
	) -> Result<(), Error> {
		config.assign(layouter.namespace(|| "Assign value"), self.value)?;

		Ok(())
	}
}
}

Range check (ex-1b)

code explanation …

Range check (Lookup table)

range check with Lookup table: useful when you’re trying to check a larger range and you want to keep the degree bound of your constraints low.

if you have a vary large R, then polynomial is going to be very high degree and that will increase the cost of your circuit so now we have to change our layout a little bit.

table

src/range_check/example2/table.rs

struct RangeTableConfig

#![allow(unused)]
fn main() {
use std::marker::PhantomData;
use halo2_proofs::{
    arithmetic::FieldExt,
    circuit::{Layouter, Value},
    plonk::{ConstraintSystem, Error, TableColumn},
};

// pub(super) 仅当前模块的父模块中可见，但不对外公开
/// A lookup table of values from 0..RANGE.
#[derive(Debug, Clone)]
pub(super) struct RangeTableConfig<F: FieldExt, const RANGE: usize> {
    pub(super) value: TableColumn, 
    // 这个 struct 中存在一个与类型 F 相关的关联，即使 struct 自身并没有实际使用这个类型
    _marker: PhantomData<F>,
}
}

fn configure

impl<F: FieldExt, const RANGE: usize> RangeTableConfig<F, RANGE>
fn configure() { :
- Define a Lookup column : let value = meta.lookup_table_column();

#![allow(unused)]
fn main() {
impl<F: FieldExt, const RANGE: usize> RangeTableConfig<F, RANGE> {
    pub(super) fn configure(meta: &mut ConstraintSystem<F>) -> Self {
        let value = meta.lookup_table_column();

        Self {
            value,
            _marker: PhantomData,
        }
    }
    // fn load ..
}

fn load()

load() assign the values to our fixed table
fn load() 是一个在 RangeTableConfig 结构体上定义的方法，它用于 load (赋值) 一个范围检查表。在这段代码中，范围检查表是一个 0 ~ RANGE-1 的 table

#![allow(unused)]
fn main() {
// load function assign the values to our fixed table
// This action is performed at key gen time
pub(super) fn load(&self, layouter: &mut impl Layouter<F>) -> Result<(), Error> {
  // firstly, for some RANGE we want to load all the values and assign it to the lookup table
  // assign_table is a special api that only works for lookup tables
  layouter.assign_table (
    || "load range-check table",
    |mut table| {
      // from row_0 to row_{RANGE-1}
      let mut offset = 0;
      for value in 0..RANGE {
        table.assign_cell(
          || "num_bits",
          self.value,
          offset,  // row num
          || Value::known(F::from(value as u64)), // assigned value
        )?;
        offset += 1;  // 循环向下赋值, 直到填满 RANGE 所需的所有列
      }

      Ok(()) // return empty tuple (∵ Result<(), Error>)
    },
  )
}
}

main fn

This helper checks that the value witnessed in a given cell is within a given range.

Depending on the range, this helper uses either a range-check expression (for small ranges), or a lookup (for large ranges).

above a certain RANGE we use a lookup argument , like $v_{1}$ , enabled q_range_check & disabled q_looup Selector
below that RANGE we stick to the simple expression, like $v_{1}$ , enabled q_looup & disabled q_range_check Selector

  value   |  q_range_check  |  q_lookup  |  table_value  |
------------------------------------------------------------
   v_0    |       1         |     0      |       0       |
   v_1    |       0         |     1      |       1       |

structs

RangeConstrained : 由 RangeCheckConfig 生成的电路中的范围约束值
RangeCheckConfig :
- main 电路的 Chip Config
- q_range_check : Selector used for small RANGE number.
- q_lookup : Selector used for large RANGE number.
- table: RangeTableConfig<F, LOOKUP_RANGE> : Lookup table

#![allow(unused)]
fn main() {
#[derive(Debug, Clone)]
/// A range-constrained value in the circuit produced by the RangeCheckConfig.
struct RangeConstrained<F: FieldExt, const RANGE: usize>(AssignedCell<Assigned<F>, F>);

#[derive(Debug, Clone)]
struct RangeCheckConfig<F: FieldExt, const RANGE: usize, const LOOKUP_RANGE: usize> {
    q_range_check: Selector,
    q_lookup: Selector,
    value: Column<Advice>,
    table: RangeTableConfig<F, LOOKUP_RANGE>, // Lookup table
}
}

fn configure()

#![allow(unused)]
fn main() {
// Write the gate for our range check Config
// It's good practive to pass advice columns to the config (rather than creating it within the config)
// because these are very likely to be shared across multiple config
impl<F: FieldExt, const RANGE: usize, const LOOKUP_RANGE: usize>
  RangeCheckConfig<F, RANGE, LOOKUP_RANGE>
{
  // Remember that the configuration happen at keygen time.
  pub fn configure(meta: &mut ConstraintSystem<F>, value: Column<Advice>) -> Self {
    // Toggles the range_check constraint
    let q_range_check = meta.selector();
    // Toggles the lookup argument
    let q_lookup = meta.complex_selector(); // for lookup table
    // configure a lookup table. and **pass it to config**
    let table = RangeTableConfig::configure(meta);

    // later we will return this config.
    let config = Self {
      q_range_check,
      q_lookup,
      value,
      table: table.clone()
    }; 

    // 1. range-check gate
    meta.create_gate("range check", |meta| {
      let q = meta.query_selector(q_range_check);

      // note that we don't need to specify the rotation when querying the `selctor`
      // That's because the selector always get queried at the current row .
      // While the `advice columns` get queried relatively to the selector offset, so we need to specify the relative rotation
      // 然而 advice col 是相对于选择器偏移量(Selector offset)进行查询的，所以我们需要指定 relative rotation.
      let value = meta.query_advice(value, Rotation::cur());

      // Given a range R and a value v, returns the multiplication expression
      //  (v) * (1 - v) * (2 - v) * ... * (R - 1 - v)
      let range_check = |range: usize, value: Expression<F>| {
        assert!(range > 0);
        (1..range).fold(value.clone(), |expr, i| {
          expr * (Expression::Constant(F::from(i as u64)) - value.clone())
        })
      };
      // like the previously using "vec![s * (a + b - c)]",
      // multiplies the specified constraint by the selector, api 将指定的约束 × Selector
      Constraints::with_selector(q, [("range check", range_check(RANGE, value))])
    });
    
    // 2. Lookup Gate  - range-check using lookup argument
    // 这个查找表将会在后面的范围检查中使用，以便在某些情况下使用查找表, 而不是表达式来执行范围检查。
    meta.lookup(|meta| {
      let q_lookup = meta.query_selector(q_lookup);
      let value = meta.query_advice(value, Rotation::cur());

      vec![(q_lookup * value, table.value)]
    });

    config
  }
}

fn assign_simple()

used for small value. We pass value and assign it on the offset.

#![allow(unused)]
fn main() {
// pass `value` and assign it on the offset.
pub fn assign_simple(
  &self,
  mut layouter: impl Layouter<F>,
  value: Value<Assigned<F>>,
) -> Result<RangeConstrained<F, RANGE>, Error> {
  layouter.assign_region(
    || "Assign value for simple range check",
    |mut region| {
      let offset = 0;

      // Enable q_range_check Selector.
      self.q_range_check.enable(&mut region, offset)?;

      // Assign `value` 
      region
        .assign_advice(
          || "value", 
          self.value,  // current col ?
          offset, 
          || value
        ).map(RangeConstrained) // 将结果转化为 RangeConstrained 类型
    },
  )
}
}

fn assign_lookup()

#![allow(unused)]
fn main() {
pub fn assign_lookup(
  &self,
  mut layouter: impl Layouter<F>,
  value: Value<Assigned<F>>,
) -> Result<RangeConstrained<F, LOOKUP_RANGE>, Error> {
  layouter.assign_region(
    || "Assign value for lookup range check",
    |mut region| {
      let offset = 0;

      // Enable q_lookup, 告诉约束系统在该区域应用这个选择器
      self.q_lookup.enable(&mut region, offset)?;

      // Assign value
      region
        .assign_advice(|| "value", self.value, offset, || value)
        .map(RangeConstrained)
      // assign_advice() 将 advice col 与值 value 关联，
      // 并将结果封装在 RangeConstrained struct 中
    },
  )}
}

Test Lookup table

#![allow(unused)]
fn main() {
// [cfg(test)]是一个条件编译属性，意思是只有在执行 test 时，此模块代码才会被编译和执行
// 好处是，当你在普通的编译或生产环境下构建你的程序时，测试代码不会被包括进去，
// 从而减少了编译时间和生成的可执行文件的大小。
#[cfg(test)]
mod tests {
    use halo2_proofs::{
        circuit::floor_planner::V1,
        dev::{FailureLocation, MockProver, VerifyFailure},
        pasta::Fp,
        plonk::{Any, Circuit},
    };

    use super::*;
    //// .....
}

struct MyCircuit

MyCircuit 可以处理 2 种类型的值 :

value : 这里的 value 的约束和赋值由 assign_simple() 完成
lookup_value : 它的约束和赋值由 assign_lookup() 完成

#![allow(unused)]
fn main() {
#[derive(Default)]
struct MyCircuit<F: FieldExt, const RANGE: usize, const LOOKUP_RANGE: usize> {
	value: Value<Assigned<F>>,
	lookup_value: Value<Assigned<F>>,
}

impl<F: FieldExt, const RANGE: usize, const LOOKUP_RANGE: usize> Circuit<F>
	for MyCircuit<F, RANGE, LOOKUP_RANGE>
{
	type Config = RangeCheckConfig<F, RANGE, LOOKUP_RANGE>;
	type FloorPlanner = V1;

	fn without_witnesses(&self) -> Self { Self::default() }

	fn configure(meta: &mut ConstraintSystem<F>) -> Self::Config {
		let value = meta.advice_column();
		RangeCheckConfig::configure(meta, value)
	}
    // fn synthesize
}

fn synthesis()

#![allow(unused)]
fn main() {
fn synthesize(
    &self,
    config: Self::Config,
    mut layouter: impl Layouter<F>,
) -> Result<(), Error> {
    // load lookup table.
    config.table.load(&mut layouter)?;

    config.assign_simple(layouter.namespace(
        || "Assign simple(smaller) value"), 
        self.value
    )?;
    config.assign_lookup(
        layouter.namespace(|| "Assign lookup(larger) value"),
        self.lookup_value,
    )?;
    Ok(())
}  }
}

test_range_check_2

在 i, j 的双重循环里:
- MyCircuit{ 1,10 }
- MyCircuit{ 7,16 }
- MyCircuit{ 5,100 }
- MyCircuit{ 7,255 } …

#![allow(unused)]
fn main() {
#[test]
fn test_range_check_2() {
  // in every circuit, we opt to reserve the last few rows of each advice cols 
  // for random values which are blinding factors(for zk), so `k` is always larger.
  let k = 9;
  const RANGE: usize = 8; // 3-bit value
  const LOOKUP_RANGE: usize = 256; // 2^8, 8-bit value

  // Successful cases
  for i in 0..RANGE {
    for j in 0..LOOKUP_RANGE {
      // According to the <i, j> to construct different Circuit.
      //MyCircuit::<Fp,.. ,..> : 指定 Constant 泛型的值.
      let circuit = MyCircuit::<Fp, RANGE, LOOKUP_RANGE> {
        simple_value: Value::known(Fp::from(i as u64).into()),
        lookup_value: Value::known(Fp::from(j as u64).into()),
      };

      let prover = MockProver::run(k, &circuit, vec![]).unwrap();
      prover.assert_satisfied();
    }
  }
}

illustration

![[Range-Check-impl-relationship.excalidraw]]

usage

cargo test -- --nocapture test_range_check_2

# Draw
cargo test --release --all-features xxx

the white column is the instance column,
the pink one is the advice and
the purple one is the selector.
the green part shows the cells that have been assigned
- light green : selector not used.

References :

https://github.com/enricobottazzi/halo2-intro/blob/master/src/range_check/example5/table.rs
Jason Morton halo2 codes
ZCash halo2 books
trapdoor-tech halo2 book
icemelon/HaiCheng Shen
0xPARC halo2

author: @Demian

references: https://learn.0xparc.org/materials/halo2

Overview

本部分是 Jason Morton 对于上一 Chapter 的代码超の详细解释： https://github.com/jasonmorton/halo2-examples/blob/master/src/range_check/example1b.rs

下面一起来看看

imports

#![allow(unused)]
fn main() {
use ff::{Field, PrimeField};
use std::marker::PhantomData; // Allows Rust to track types that do not otherwise appear in a struct's fields, here just the field element type

use halo2_proofs::{
    circuit::{
        floor_planner::V1,
        AssignedCell, // a value Value<V> together with its global location as a Cell with region_index, row_offset, and column
        Layouter,     // layout strategy and accepter struct, a bit like a Writer
        Value,        // basically an Option<V>, where Some(v) is called known and None is unknown
    },
    plonk::{
        Advice,      // empty struct to mark Advice columns
        Assigned, // enum Zero, Trivial(F) "does not require inversion to evaluate", or Rational(F, F) "stored as a fraction to enable batch inversion". This is an actual value (wrapped felt)
        Circuit,  // trait with without_witnesses, configure, and synthesize methods
        Column, // represents a pre-layout abstract Column. Fields are index: usize and column type.
        ConstraintSystem, // The container for the actual constraint system; much of the frontend code exists to make it easier to populate this container
        Constraints, // Iterable with a selector and Constraint s.  Constraints are single polynomial Expressions returned by create gate
        Error,       // Custom Error type
        Expression, // Polynomial expression enum, as binary tree, with 5 types of atomic variables v (Constant, Selector, Fixed, Advice, Instance) and combinations -v, v+v, a*v, or v*v.
        Selector, // (index: usize, simple: bool) column type, w/ index = index of this selector in the ConstraintSystem, simple = "can only be multiplied by Expressions not containing Selectors"
    },
    poly::Rotation, // i32 wrapper representing rotation in Lagrange basis
};
}

AssignedCell：AssignedCell 表示一个与其全局位置相关联的值 Value<V>，该位置定义为 Cell，字段： region_index, row_offset 和 column
Value：Value 本质是一个 Option<V> ，其中 Some(v) 被称为 known（已知），而 None 则是 unknown（未知）
Assigned：Assigned 是一个 enum 枚举类型，有 Zero, Trivial(F) 和 Rational(F, F) 三个成员。其中
- Trivial(F) “A value that does not require inversion to evaluate.”，
- Rational(F, F) “存储为分数以便进行批量取反 (A value stored as a fraction to enable batch inversion.)” ，这是一个实际的值（wrapped felt）
Circuit：Circuit 是一个 trait，具有 without_witnesses, configure 和 synthesize 方法
ConstraintSystem：ConstraintSystem 是实际约束系统的容器；大部分前端代码的存在都是为了更容易地填充这个容器
Constraints ：提供了一个新的 API 来进行约束
Expression：
- Expression 是多项式表达式的枚举类型，表现为二叉树，拥有5种类型的原子变量 v（Constant, Selector, Fixed, Advice, Instance）以及combination -v, v+v, a*v, or v*v.
- Low-degree expression representing an identity that must hold over the committed columns.

#![allow(unused)]
fn main() {
// Config 是您自定义电路的关联类型（仅要求实现 Clone trait）。它没有特定的强制结构，存储所需的任何类型信息
// A Config is an associated type of your custom circuit (required only to be Clone).  With no particular enforced structure, it stores whatever type information is needed

// to understand the constraint system (number and types of columns, their indices, some flags such as simple/complex selector, etc.).
// It is a bit like a morphism type in a Monoidal category (domain and codomain), or the row and column labels in a dataframe. Let's call it the FrameType
// It can be unstructured because it is the Circuit implementer's job to translate this information into the format needed for the Layouter.

#[derive(Clone)]
struct MyConfig<F: PrimeField, const RANGE: usize> {
    advice_column: Column<Advice>,  // a marker and index for a Selector
    q_range_check: Selector,   // similarly a marker and index for a Selector
    _marker: PhantomData<F>,
}

// 通常，Config 会有一个 configure 和 assign 方法，它们由 Circuit 的 configure 和 synthesize 方法委托。在这个版本的示例中，我们将直接在电路中放置此逻辑。
// By convention the Config gets a configure() and assign() method, which are delegated to by the configure and synthesize method of the Circuit.
// In this version of the example we will put this logic directly in the circuit.
impl<F: PrimeField, const RANGE: usize> MyConfig<F, RANGE> {}

#[derive(Default)] // Deriving Default calls Default on Value<Assigned<F>> calls impl<V> Default for Value<V> { fn default() -> Self {  Self::unknown()  }}
                   // which in turn sets value.inner: Option<V> to None
struct MyCircuit<F: PrimeField, const RANGE: usize> {
    assigned_value: Value<Assigned<F>>,
    _marker: PhantomData<F>,
}
impl<F: PrimeField, const RANGE: usize> MyCircuit<F, RANGE> {}
}

impl Circuit for MyCircuit

#![allow(unused)]
fn main() {
// Your Circuit plays several roles and  will be passed to prover and verifier key generation, prove, and verifier.
// Implementing the Circuit trait requires three functions:
// 1) Anything special that needs to be done to set it up without witness values (which will be used in p&v key generation), usually just all witness
//    values are set to None (Remember Value is basically an alias of Option).
// 2) How to 'configure' it.  This is a bit mysterious because the required trait method configure just returns your custom associated type
//    Config, which in turn need only be Clone.  So what is happening? If we look at the MockProver code, we see that an empty ConstraintSystem is
//    created and passed to the configure function as mutable, then an immutable borrow is taken and worked with for the duration:
//         let mut cs = ConstraintSystem::default();
//         let config = ConcreteCircuit::configure(&mut cs);
//         let cs = cs;
//    Thus it the Circuit's `configure` method that is responsible for all of the contraint system definition.  It could be called compile_constraints.
}

电路会扮演多个角色，并且会被传递给 prover 、 verifier 来进行 key generation, prove, and verify.

without_witnesses 通常在 p&v key generation 期间使用
How to ‘configure’ it? 如果我们查看 MockProver 代码，我们可以看到创建了一个空的 ConstraintSystem，传递给 configure() 作为可变引用

#![allow(unused)]
fn main() {
//    Why does the configure method accept an empty constraint system and return the arbitrary Self::Config, after filling the constaint system to its liking?
//    The config returned by ConcreteCircuit ::configure is used just once in the MockProver:
//         ConcreteCircuit::FloorPlanner::synthesize(&mut prover, circuit, config, constants)?;
//    So after setting up the constraints, the Config stores the information about the layout that the floor planner will need to synthesize.
//
//    The `configure` function is where we call cs.create_gate() and so on, adding polynomials to the system.  At this point, the variables in these polynomials
//    are still locally named/scoped, and will be given a global name/scope during layout.
}

为什么 configure 方法接受一个空的约束系统，并在填充约束系统后返回任意的 Self::Config？

ConcreteCircuit::configure 返回的 config 在 MockProver 中只使用一次：
ConcreteCircuit::FloorPlanner::synthesize(&mut prover, circuit, config, constants)?;
因此，在设置约束之后，Config 存储了 floor planner 在合成时需要的布局信息。

#![allow(unused)]
fn main() {
// 3) How to synthesize, given the circuit, a provided &mut Layouter and the data passed in the Config.  The synthesize method returns only error information, and
//    changes state by writing to the Layouter.  Thus the Layouter is like a buffer or Writer to which the final circuit is written.  One will be supplied by the
//    MockProver below (and variants will be needed during keygen and proving).
//
//  Roughly, configure provides the concrete but relative layout, and synthesize combines such blocks and assigns an absolute layout.
impl<F: PrimeField, const RANGE: usize> Circuit<F> for MyCircuit<F, RANGE> {
    type Config = MyConfig<F, RANGE>;
    type FloorPlanner = V1;

    // This boilerplate could be removed by putting it in the Circuit trait and defining the Circuit trait with a bound as Circuit: Default, but that might be annoying too.
    fn without_witnesses(&self) -> Self {
        Self::default() // should fill all the Witness Values with None/Unknown.
    }
}

How to synthesize?

给定电路 Circuit、 &mut Layouter 和在 Config 中传递的数据。synthesize 方法只返回错误信息，并通过写入 Layouter 更改状态。因此，Layouter 就像最终电路被写入的缓冲区或 Writer。

大致来说，configure 提供了具体但相对的布局，而 synthesize 组合这些块并分配绝对布局。

fn configure()

#![allow(unused)]
fn main() {
// define the constraints, mutate the provided ConstraintSystem, and output the resulting FrameType
// 改变(mutate) 提供的 ConstraintSystem，并输出结果的 FrameType
fn configure(cs: &mut ConstraintSystem<F>) -> Self::Config {
	// Create the column marker types. Requests the CS to allocate a new column (giving it a unique cs-global index and incrementing its
	// 创建列标记类型。请求 CS 分配一个新列（给它一个唯一的 cs-global 索引并增加它的
	//   num_selectors, num_fixed_columns, num_advice_columns, or num_instance_columns).
	let advice_column = cs.advice_column();
	let q_range_check = cs.selector();

	// When we use cs.query_advice or cs.query_selector, we obtain an Expression which is a reference to a cell in the matrix.
	// 访问 cs.query_advice / query_selector 获得一个 Expression，它是矩阵中一个单元格的引用(reference)
	//   Expression::Advice {
	//     query_index: self.meta.query_advice_index(column, at),
	//     column_index: column.index,
	//     rotation: at,
	//   }
	// Such an a_{ij} or a_{this_row + at, column} can be treated as a symbolic variable and put into a polynomial constraint.
	// More precisely, this is a relative reference wrt rows. 
	// 例如 a_{ij} / a_{this_row + at, column} 会被视为一个符号变量，并放入一个多项式约束中。
	// (这是一个相对于行的相对引用)

	// cs.create_gate takes a function from virtual_cells to contraints, pushing the constraints to the cs's accumulator.  So this puts
	// (value.clone()) * (1 - value.clone()) * (2 - value.clone()) * ... * (R - 1 - value.clone())
	// into the constraint list.
	// 注意 [VirtualCells], 它持有对`ConstraintSystem`的可变引用，存储已查询的选择器/不同类型的列
	cs.create_gate("range check", |virtual_cells| {
		let q = virtual_cells.query_selector(q_range_check);
		let value = virtual_cells.query_advice(advice_column, Rotation::cur());

		// Given a range R and a value v, returns the expression
		// (v) * (1 - v) * (2 - v) * ... * (R - 1 - v)
		//  Range Check poly:
		let rc_polynomial = (1..RANGE).fold(value.clone(), |expr, i| {
			expr * (Expression::Constant(F::from(i as u64)) - value.clone())
		});

		Constraints::with_selector(q, [("range check", rc_polynomial)])
	});

	// The "FrameType"
	Self::Config {
		q_range_check,
		advice_column,
		_marker: PhantomData,
	}
}
}

query_selector & query_advice

When we use cs.query_advice or cs.query_selector, we obtain an Expression which is a reference to a cell in the matrix.
一个 a_{ij} 或 a_{this_row + at, column} 可以被视为一个符号变量，并放入一个多项式约束中。更准确地说，这是一个相对于行的相对引用。

fn synthesize()

#![allow(unused)]
fn main() {
fn synthesize(
	&self,
	config: Self::Config,
	mut layouter: impl Layouter<F>, // layouter is our 'write buffer' for the circuit
) -> Result<(), Error> {
	// From the function docs:
	// Assign a region of gates to an absolute row number. 将门的 region 分配一个绝对行号。
	// Inside the closure, the chip may freely use relative offsets; the `Layouter` will
	// treat these assignments as a single "region" within the circuit. Outside this
	// closure, the `Layouter` is allowed to optimise as it sees fit.
	// 闭包内，chip 可以自由使用相对偏移；`Layouter` 会将这些 assignments 视为电路中的单个“region”。
	// 在闭包外部，`Layouter` 可以根据需要进行优化

	layouter.assign_region(
		|| "Assign value", // the name of the region
		|mut region| {
			let offset = 0;

			// Enable q_range_check. Remember that q_range_check is a label, a Selector. Calling its enable
			// - calls region.enable_selector(_,q_range_check,offset)  which
			// - calls enable_selector on the region's RegionLayouter which
			// - calls enable_selector on its "CS" (actually an Assignment<F> (a trait), and whatever impls that
			// does the work, for example for MockProver the enable_selector function does some checks and then sets
			//   self.selectors[selector.0][row] = true;
			config.q_range_check.enable(&mut region, offset)?;

			// Similarly after indirection calls assign_advice in e.g. the MockProver, which
			// takes a Value-producing to() and does something like
			// CellValue::Assigned(to().into_field().evaluate().assign()?);
			// 类似 MockProver 间接调用 assign_advice, 它接受一个 Value-producing 的 to() (进行赋值)
			region.assign_advice(
				|| "value",
				config.advice_column,
				offset,
				|| self.assigned_value,
			)
		},
	)?;
	Ok(())
} }
}

tests

#![allow(unused)]
fn main() {
#[cfg(test)]
mod tests {
    use halo2_proofs::{
        dev::{FailureLocation, MockProver, VerifyFailure},
        pasta::Fp,
        plonk::{Any, Circuit},
    };

    use super::*;

    #[test]
    fn test_range_check_1() {
        let k = 4; //2^k rows
        const RANGE: usize = 8; // 3-bit value
        let testvalue: u64 = 22;

        // Successful cases
        for i in 0..RANGE {
            let circuit = MyCircuit::<Fp, RANGE> {
                assigned_value: Value::known(Fp::from(i as u64).into()),
                _marker: PhantomData,
            };

            // The MockProver arguments are log_2(nrows), the circuit (with advice already assigned), and the instance variables.
            // The MockProver will need to internally supply a Layouter for the constraint system to be actually written.
            // k 对应 2^k 行, MockProver 将需要内部提供一个 Layouter，以便实际编写约束系统
            let prover = MockProver::run(k, &circuit, vec![]).unwrap();
            prover.assert_satisfied();
        }

        // Out-of-range `value = 8`
        {
            let circuit = MyCircuit::<Fp, RANGE> {
                assigned_value: Value::known(Fp::from(testvalue).into()),
                _marker: PhantomData,
            };
            let prover = MockProver::run(k, &circuit, vec![]).unwrap();
            assert_eq!(
                prover.verify(),
                Err(vec![VerifyFailure::ConstraintNotSatisfied {
                    constraint: ((0, "range check").into(), 0, "range check").into(),
                    location: FailureLocation::InRegion {
                        region: (0, "Assign value").into(),
                        offset: 0
                    },
                    cell_values: vec![(((Any::Advice, 0).into(), 0).into(), "0x16".to_string())]
                }])
            );
        }
    }
}
}

References :

https://github.com/enricobottazzi/halo2-intro/blob/master/src/range_check/example5/table.rs
Jason Morton halo2 codes
ZCash halo2 books
trapdoor-tech halo2 book
icemelon/HaiCheng Shen
0xPARC halo2

author: @Demian

references: https://learn.0xparc.org/materials/halo2

Overview

上一章节使用的 (v) * (1 - v) * (2 - v) * ... * (R - 1 - v)，本章使用了 Lookup Table 来执行范围检查。

连乘表达式的问题：如果数字 “R” 很大，那么多项式的次数将非常高，这会增加电路的成本，所以现在我们必须稍微改变我们的布局：使用查找表进行范围检查：当您尝试检查更大的范围并且希望将约束的度数限制保持在较低水平时非常有用。

（if you have a vary large R, then polynomial is going to be very high degree and that will increase the cost of your circuit so now we have to change our layout a little bit. range check with Lookup table: useful when you’re trying to check a larger range and you want to keep the degree bound of your constraints low.）

文件架构：

#![allow(unused)]
fn main() {
├── range_check
│   ├── example2
│   │   └── table.rs  // lookup table
│   ├── example2.rs   // main config
}

调用链：

impl relationship：

Draw the circuit：

![[Range-Check-impl-relationship.excalidraw]]

lookup table - table.rs

src/range_check/example2/table.rs

struct RangeTableConfig

#![allow(unused)]
fn main() {
use std::marker::PhantomData;
use halo2_proofs::{
    arithmetic::FieldExt,
    circuit::{Layouter, Value},
    plonk::{ConstraintSystem, Error, TableColumn},
};

// pub(super) 仅当前模块的父模块中可见，但不对外公开
/// A lookup table of values from 0..RANGE.
#[derive(Debug, Clone)]
pub(super) struct RangeTableConfig<F: FieldExt, const RANGE: usize> {
    pub(super) value: TableColumn, 
    // 这个 struct 中存在一个与类型 F 相关的关联，即使 struct 自身并没有实际使用这个类型
    _marker: PhantomData<F>,
}
}

fn configure()

泛型常量参数 const N: usize，来处理不同大小和类型的数组
meta.lookup_table_column(); 实际会返回一个 fixed_column

#![allow(unused)]
fn main() {
impl<F: FieldExt, const RANGE: usize> RangeTableConfig<F, RANGE> {
    pub(super) fn configure(meta: &mut ConstraintSystem<F>) -> Self {
        let value = meta.lookup_table_column(); // Define a  *Lookup column*
        Self {
            value,
            _marker: PhantomData,
        }
    }
    // fn load ..
}

halo2_proofs/src/plonk/circuit.rs :

#![allow(unused)]
fn main() {
    /// Allocates a new fixed column that can be used in a lookup table.
    pub fn lookup_table_column(&mut self) -> TableColumn {
        TableColumn {
            inner: self.fixed_column(),
        }
    }
}

fn load()

load() assign the values to our fixed table
fn load() 是一个在 RangeTableConfig 结构体上定义的方法，它用于 load (赋值) 一个范围检查表。在这段代码中，范围检查表是一个 0 ~ RANGE-1 的 table

#![allow(unused)]
fn main() {
// load function assign the values to our fixed table
// This action is performed at key gen time
pub(super) fn load(&self, layouter: &mut impl Layouter<F>) -> Result<(), Error> {
  // firstly, for some RANGE we want to load all the values and assign it to the lookup table
  // assign_table is a special api that only works for lookup tables
  layouter.assign_table (
    || "load range-check table",
    |mut table| {
      // from row_0 to row_{RANGE-1}
      let mut offset = 0;
      for value in 0..RANGE {
        table.assign_cell(
          || "num_bits",
          self.value,
          offset,  // row num
          || Value::known(F::from(value as u64)), // assigned value
        )?;
        offset += 1;  // 循环向下赋值, 直到填满 RANGE 所需的所有列
      }

      Ok(()) // return empty tuple (∵ Result<(), Error>)
    },
  )
}
}

main - example2.rs

Overview

This helper checks that the value witnessed in a given cell is within a given range.

Depending on the range, this helper uses either a range-check expression (for small ranges), or a lookup (for large ranges).

above a certain RANGE we use a lookup argument , like $v_{1}$ , enabled q_range_check & disabled q_looup Selector
below that RANGE we stick to the simple expression, like $v_{1}$ , enabled q_looup & disabled q_range_check Selector

  value   |  q_range_check  |  q_lookup  |  table_value  |
------------------------------------------------------------
   v_0    |       1         |     0      |       0       |
   v_1    |       0         |     1      |       1       |

在一个比较小的特定范围里，使用 range-check 连乘 expression
对于比较大的查找范围，使用 Lookup Table 查找表

structs

RangeConstrained : 由 RangeCheckConfig 生成的电路中的范围约束值 (range-constrained value)，即用来表示一个范围受限的值。
RangeCheckConfig : main 电路的 Chip Config，用于配置和执行范围检查
- q_range_check : Selector used for small RANGE number.
- q_lookup : Selector used for large RANGE number.
- value：an Advice column 用于存储 Private value without revealing it.
- table: RangeTableConfig<F, LOOKUP_RANGE> : Lookup table

#![allow(unused)]
fn main() {
#[derive(Debug, Clone)]
/// A range-constrained value in the circuit produced by the RangeCheckConfig.
struct RangeConstrained<F: FieldExt, const RANGE: usize>(AssignedCell<Assigned<F>, F>);

#[derive(Debug, Clone)]
struct RangeCheckConfig<F: FieldExt, const RANGE: usize, const LOOKUP_RANGE: usize> {
    q_range_check: Selector,
    q_lookup: Selector,
    value: Column<Advice>,
    table: RangeTableConfig<F, LOOKUP_RANGE>, // Lookup table
}
}

impl RangeCheckConfig

fn configure()

在 query_selector 即查询 Selector 时，无需指定显式 rotation，因为 selector always get queried at the current row .
在 query_advice 即查询 Advice 时，因为 advice col 是相对于 Selector 偏移量(Selector offset)进行查询的，所以我们需要指定 relative rotation.
不像之前我们在 configure() 函数内部声明 Advice column：

#![allow(unused)]
fn main() {
pub fn configure(){
  let col_a = meta.advice_column();
  meta.enable_equality(col_a); // 在 `configure()` 内部声明 Advice column：
  /// ...
}
}

在本 configure() 中，我们传入 value: Column<Advice>) ，这样可以更方便地 shared across multiple config ：

#![allow(unused)]
fn main() {
// 在 impl Circuit for MyCircuit 中调用：
fn configure(meta: &mut ConstraintSystem<F>) -> Self::Config {
	let value = meta.advice_column(); // 声明 value 这个 Advice column
	RangeCheckConfig::configure(meta, value) // 传入 value 这个 Advice column
}
}

在 meta.create_gate 过程中，创建了 1 个约束门，赋值了 1 个 special fixed colum ：

meta.create_gate("range check".. 门：使用 range-check 连乘 expression 限制小范围数字
meta.lookup(|meta| { .. 门：Fix 查找表，在一个更大的范围内进行约束

#![allow(unused)]
fn main() {
// Write the gate for our range check Config
// It's good practive to pass advice columns to the config (rather than creating it within the config)
// because these are very likely to be shared across multiple config
impl<F: FieldExt, const RANGE: usize, const LOOKUP_RANGE: usize>
  RangeCheckConfig<F, RANGE, LOOKUP_RANGE>
{
  // Remember that the configuration happen at keygen time.
  pub fn configure(meta: &mut ConstraintSystem<F>, value: Column<Advice>) -> Self {
    // Toggles the range_check constraint
    let q_range_check = meta.selector();
    // Toggles the lookup argument
    let q_lookup = meta.complex_selector(); // for lookup table
    // configure a lookup table. and **pass it to config**
    let table = RangeTableConfig::configure(meta);

    // later we will return this config.
    let config = Self {
      q_range_check,
      q_lookup,
      value,
      table: table.clone()
    }; 

    // 1. range-check gate
    meta.create_gate("range check", |meta| {
      let q = meta.query_selector(q_range_check);

      // note that we don't need to specify the rotation when querying the `selctor`
      // That's because the selector always get queried at the current row .
      // While the `advice columns` get queried relatively to the selector offset, so we need to specify the relative rotation
      // 然而 advice col 是相对于选择器偏移量(Selector offset)进行查询的，所以我们需要指定 relative rotation.
      let value = meta.query_advice(value, Rotation::cur());

      // Given a range R and a value v, returns the multiplication expression
      //  (v) * (1 - v) * (2 - v) * ... * (R - 1 - v)
      let range_check = |range: usize, value: Expression<F>| {
        assert!(range > 0);
        (1..range).fold(value.clone(), |expr, i| {
          expr * (Expression::Constant(F::from(i as u64)) - value.clone())
        })
      };
      // like the previously using "vec![s * (a + b - c)]",
      // multiplies the specified constraint by the selector, api 将指定的约束 × Selector
      Constraints::with_selector(q, [("range check", range_check(RANGE, value))])
    });
    
    // 2. Lookup Gate  - range-check using lookup argument
    // 这个查找表将会在后面的范围检查中使用，以便在某些情况下使用查找表, 而不是表达式来执行范围检查。
    meta.lookup(|meta| {
      let q_lookup = meta.query_selector(q_lookup);
      let value = meta.query_advice(value, Rotation::cur());

      vec![(q_lookup * value, table.value)]
    });

    config
  }
}

如何协同？

#![allow(unused)]
fn main() {
// 1. 定义 Circuit
let circuit = MyCircuit::<Fp, RANGE, LOOKUP_RANGE> {
	simple_value: Value::known(Fp::from(i as u64).into()),
	lookup_value: Value::known(Fp::from(j as u64).into()),
};

// 2. 将 circuit 传入 MockProver::run()
// 3. run() 中  (halo2_proofs/src/dev.rs ) ：
// 3.1  ConcreteCircuit::configure
// 3.2  ConcreteCircuit::FloorPlanner::synthesize
impl<F: Field + Ord> MockProver<F> {
    /// Runs a synthetic keygen-and-prove operation on the given circuit,  
    /// collecting data about the constraints and their assignments.
    pub fn run<>(){
        let mut cs = ConstraintSystem::default();
        let config = ConcreteCircuit::configure(&mut cs);
        let cs = cs;
        // ...
        ConcreteCircuit::FloorPlanner::synthesize(&mut prover, circuit, config, constants)?;
    }
}

在 synthesize 中：

fn assign_simple()

used for small value. We pass value and assign it on the offset.

#![allow(unused)]
fn main() {
// pass `value` and assign it on the offset.
pub fn assign_simple(
  &self,
  mut layouter: impl Layouter<F>,
  value: Value<Assigned<F>>,
) -> Result<RangeConstrained<F, RANGE>, Error> {
  layouter.assign_region(
    || "Assign value for simple range check",
    |mut region| {
      let offset = 0;

      // Enable q_range_check Selector.
      self.q_range_check.enable(&mut region, offset)?;

      // Assign `value` 
      region
        .assign_advice(
          || "value", 
          self.value,  // current col ?
          offset, 
          || value
        ).map(RangeConstrained) // 将结果转化为 RangeConstrained 类型
    },
  )
}
}

fn assign_lookup()

#![allow(unused)]
fn main() {
pub fn assign_lookup(
  &self,
  mut layouter: impl Layouter<F>,
  value: Value<Assigned<F>>,
) -> Result<RangeConstrained<F, LOOKUP_RANGE>, Error> {
  layouter.assign_region(
    || "Assign value for lookup range check",
    |mut region| {
      let offset = 0;

      // Enable q_lookup, 告诉约束系统在该区域应用这个选择器
      self.q_lookup.enable(&mut region, offset)?;

      // Assign value
      region
        .assign_advice(|| "value", self.value, offset, || value)
        .map(RangeConstrained)
      // assign_advice() 将 advice col 与值 value 关联，
      // 并将结果封装在 RangeConstrained struct 中
    },
  )}
}

assign_simple & assign_lookup 这 2 个函数的区别：

#![allow(unused)]
fn main() {
1. 泛型常量
 - RANGE
 - LOOKUP_RANGE
2. Selector enabled:
 - q_range_check // for *small* RANGE number.
 - q_lookup      // for *large* RANGE number.

region.assign_advic 部分是一样的
}

Test Lookup table

#![allow(unused)]
fn main() {
// [cfg(test)]是一个条件编译属性，意思是只有在执行 test 时，此模块代码才会被编译和执行
// 好处是，当你在普通的编译或生产环境下构建你的程序时，测试代码不会被包括进去，
// 从而减少了编译时间和生成的可执行文件的大小。
#[cfg(test)]
mod tests {
    use halo2_proofs::{
        circuit::floor_planner::V1,
        dev::{FailureLocation, MockProver, VerifyFailure},
        pasta::Fp,
        plonk::{Any, Circuit},
    };

    use super::*;
    //// .....
}

struct MyCircuit

MyCircuit 可以处理 2 种类型的值 :

value : 这里的 value 的约束和赋值由 assign_simple() 完成
lookup_value : 它的约束和赋值由 assign_lookup() 完成

#![allow(unused)]
fn main() {
#[derive(Default)]
struct MyCircuit<F: FieldExt, const RANGE: usize, const LOOKUP_RANGE: usize> {
	value: Value<Assigned<F>>,
	lookup_value: Value<Assigned<F>>,
}

impl<F: FieldExt, const RANGE: usize, const LOOKUP_RANGE: usize> Circuit<F>
	for MyCircuit<F, RANGE, LOOKUP_RANGE> {
	type Config = RangeCheckConfig<F, RANGE, LOOKUP_RANGE>;
	type FloorPlanner = V1;

	fn without_witnesses(&self) -> Self { Self::default() }

	fn configure(meta: &mut ConstraintSystem<F>) -> Self::Config {
		let value = meta.advice_column();
		RangeCheckConfig::configure(meta, value)
	}
    // fn synthesize
}

fn synthesis()

#![allow(unused)]
fn main() {
fn synthesize(
    &self,
    config: Self::Config,
    mut layouter: impl Layouter<F>,
) -> Result<(), Error> {
    // load lookup table.
    config.table.load(&mut layouter)?;

    config.assign_simple(layouter.namespace(
        || "Assign simple(smaller) value"), 
        self.value
    )?;
    config.assign_lookup(
        layouter.namespace(|| "Assign lookup(larger) value"),
        self.lookup_value,
    )?;
    Ok(())
}  }
}

test_range_check_2

在 i, j 的双重循环里:
- MyCircuit{ 1,10 }
- MyCircuit{ 7,16 }
- MyCircuit{ 5,100 }
- MyCircuit{ 7,255 } …

like :

#![allow(unused)]
fn main() {
#[test]
fn test_range_check_2() {
  // in every circuit, we opt to reserve the last few rows of each advice cols 
  // for random values which are blinding factors(for zk), so `k` is always larger.
  let k = 9;
  const RANGE: usize = 8; // 3-bit value
  const LOOKUP_RANGE: usize = 256; // 2^8, 8-bit value

  // Successful cases
  for i in 0..RANGE {
    for j in 0..LOOKUP_RANGE {
      // According to the <i, j> to construct different Circuit.
      //MyCircuit::<Fp,.. ,..> : 指定 Constant 泛型的值.
      let circuit = MyCircuit::<Fp, RANGE, LOOKUP_RANGE> {
        simple_value: Value::known(Fp::from(i as u64).into()),
        lookup_value: Value::known(Fp::from(j as u64).into()),
      };

      let prover = MockProver::run(k, &circuit, vec![]).unwrap();
      prover.assert_satisfied();
    }
  }
}

illustration

usage

cargo test -- --nocapture test_range_check_2

# Draw
cargo test --release --all-features xxx

the white column is the instance column,
the pink one is the advice and
the purple one is the selector.
the green part shows the cells that have been assigned
- light green : selector not used.

References :

https://github.com/enricobottazzi/halo2-intro/blob/master/src/range_check/example5/table.rs
Jason Morton halo2 codes
ZCash halo2 books
trapdoor-tech halo2 book
icemelon/HaiCheng Shen
0xPARC halo2

author: @Demian

references: https://learn.0xparc.org/materials/halo2/learning-group-1/exercise-3

Goal

we can look up smaller ranges, for example our lookup table right now is eight bits, but using a single lookup table we can constrain a one bit value, or two bit value, 3-bit value and we don’t always have to be constraining the maximum range of 8-bits.

our range is 8 bits, but we want to perform a range check on 4 bits.

Overview

文件架构：

#![allow(unused)]
fn main() {
├── range_check
│   ├── example3
│   │   └── table.rs  // lookup table
│   ├── example3.rs   // main config
}

本部分代码的更新：

Table：
- num_bits: TableColumn RangeTableConfig 中新增一列

Pre-requisites

value in (1 << (num_bits - 1))..(1 << num_bits) 这个范围的意思是？

这个范围是用来确定在给定的二进制位数num_bits下，一个数字可以表示的最小值和最大值

(1 << (num_bits - 1)): 这是取 2 的num_bits - 1次幂。在计算机编程中，<< 是左移操作，它等同于将 1 乘以 2 的给定次幂。结果是该位数的最小值。
(1 << num_bits): 这是取 2 的num_bits次幂，代表了在给定的num_bits位数下的最大值 +1 （因为范围的上限是不包含的）

如果num_bits = 3:

最小值是 `1 << (3-1) = 4
- 1 << 2 即 1 左移 2 位 :
  - 当我们左移一位（1 << 1）时， 0001 变成了 0010 即 2
  - 当我们左移二位（1 << 2）时， 0001 变成了 0100 即 4
  - 当我们左移三位（1 << 3）时， 0001 变成了 1000 即 8
上限值是 1 << 3 = 8 (不含 8) 因此，该范围表示的数字集合为 {4, 5, 6, 7}
eg.100 是 4 , 111 是 4+2+1 = 7

如果num_bits = 4:

最小值是 1 << (4-1)s = 8
上限值是 1 << 4 = 16(不含) 因此，该范围表示的数字集合为 {8, 9, 10, ..., 15}
eg. 1000 是 8 , 1111 是 8+4+2+1 = 15

这个范围用于确保在给定的 num_bits 下，他所能表示的数字的值在预期的最小和最大之间

lookup table - table.rs

src/range_check/example2/table.rs

struct RangeTableConfig

对比 example-2 和 example-3 ：

#![allow(unused)]
fn main() {
// example 2
pub(super) struct RangeTableConfig<F: FieldExt, const RANGE: usize> {
    pub(super) value: TableColumn, 
    _marker: PhantomData<F>,
}

// example 3
/// A lookup table of values up to RANGE
/// e.g. RANGE = 256, values = [0..255]
/// This table is tagged by an index `k`, where `k` is the number of bits of the element in the `value` column.
pub(super) struct RangeTableConfig<F: FieldExt, const NUM_BITS: usize, const RANGE: usize> {
    pub(super) num_bits: TableColumn, // tag for our table.
    pub(super) value: TableColumn,
    _marker: PhantomData<F>,
}
}

impl RangeTableConfig {..

fn configure()

#![allow(unused)]
fn main() {
impl<F: PrimeField, const NUM_BITS: usize, const RANGE: usize> RangeTableConfig<F, NUM_BITS, RANGE> {
    pub(super) fn configure(meta: &mut ConstraintSystem<F>) -> Self {
        assert_eq!(1 << NUM_BITS, RANGE);  // "1" 左移一位 NUM_BITS 位, 即变大 2^NUM_BITS 倍

        let num_bits = meta.lookup_table_column();
        let value = meta.lookup_table_column();

        Self {
            num_bits,
            value,
            _marker: PhantomData,
        }
    }
}

fn load()

赋值 2 列 lookup column 的首行为：(num_bits = 1, value = 0)
1. 0 的二进制编码为 0，占 1 位
后面就是在给定 NUM_BITS 下能表示的上下界中赋值：
1. 如 value=2 ，那么 num_bits=2 （∵ 2 的二进制表示是 10 ，有 2 位）；
2. 如 value=8，那么num_bits=4（∵ 8 的二进制表示是 1000，有 4 位）。
3. 简而言之，num_bits 描述了表示 value 所需的最小位数。

前面也提到，这个范围用于确保在给定的 num_bits 下，数字的值在预期的最小和最大之间：

如果num_bits = 4:

最小值是 1 << (4-1)s = 8
上限值是 1 << 4 = 16(不含) 因此，该范围表示的数字集合为 {8, 9, 10, ..., 15}
eg. 1000 是 8 , 1111 是 8+4+2+1 = 15

#![allow(unused)]
fn main() {
pub(super) fn load(&self, layouter: &mut impl Layouter<F>) -> Result<(), Error> {
	layouter.assign_table(
		|| "load range-check table",
		|mut table| {
			let mut offset = 0;

			// Assign (num_bits = 1, value = 0), 2 列都是 lookup columns.
			// 这部分是赋值首行, 为 num_bits 和 value 分配了其首个值，即 1 和 0, 方便下面累加
			{
				table.assign_cell(
					|| "assign num_bits",
					self.num_bits,
					offset,
					|| Value::known(F::ONE),
				)?;
				table.assign_cell(
					|| "assign value",
					self.value,
					offset,
					|| Value::known(F::ZERO),
				)?;

				offset += 1;
			}

			// (1 << (num_bits_ - 1))..(1 << num_bits_) : 在给定的 NUM_BITS 下的 min & max value.
			//   num_bits_ 标识了 value 所占的位数,比如 213
			//   value_ 则是实际赋值(约束)到电路里的实际 Private value
			for num_bits_ in 1..=NUM_BITS {
				for value_ in (1 << (num_bits_ - 1))..(1 << num_bits_) {
					table.assign_cell(
						|| "assign num_bits",
						self.num_bits,
						offset,
						|| Value::known(F::from(num_bits_ as u64)),
					)?;
					table.assign_cell(
						|| "assign value",
						self.value,
						offset,
						|| Value::known(F::from(value_ as u64)),
					)?;
					offset += 1;
				}
			}
			Ok(())
		},
	)
} }
}

main - example3.rs

Overview

This helper uses a lookup table to check that the value witnessed in a given cell is within a given range.

The lookup table is tagged by num_bits to give a strict range check.

       value     |   q_lookup  |  table_num_bits  | lookup table_value  |
      -------------------------------------------------------------
         v_0     |      0      |        1         |       0       |
         v_1     |      1      |        1         |       1       |
         ...     |     ...     |        2         |       2       |
         ...     |     ...     |        2         |       3       |
         ...     |     ...     |        3         |       4       |

We use a K-bit lookup table, that is tagged 1..=K, where the tag i marks an i-bit value. 使用 K 位查找表，标记为 1 ..= K，其中标记 i 标记 i 位值

structs

RangeConstrained 加一字段：num_bits: AssignedCell<Assigned<F>, F>,
RangeCheckConfig 加一 Advice col：num_bits

#![allow(unused)]
fn main() {
#[derive(Debug, Clone)]
/// A range-constrained value in the circuit produced by the RangeCheckConfig.
struct RangeConstrained<F: PrimeField> {
    num_bits: AssignedCell<Assigned<F>, F>,
    assigned_cell: AssignedCell<Assigned<F>, F>,
}

struct RangeCheckConfig<F: FieldExt, const NUM_BITS: usize, const RANGE: usize> {
    q_lookup: Selector,
    num_bits: Column<Advice>, /////// 
    value: Column<Advice>,
    table: RangeTableConfig<F, NUM_BITS, RANGE>,
}
}

impl RangeCheckConfig

当 q_lookup（complex_selector）被激活或禁用时，应该使用哪些值进行查找

q_lookup和not_q_lookup分别表示查找被激活或禁用的情况
默认： Selector 不被激活时，直接使用位数为 1 的默认值和值为 0 的默认值，确保约束成立
当激活 Selector，它将使用提供的 Advice col 中的实际值
这确保了当不需要范围检查时，查找仍然是有效的，并且查找表中有相应的条目。

vec![(num_bits_expr, table.num_bits), (value_expr, table.value)] :

2 个约束 (num_bits_expr, table.num_bits), (value_expr, table.value) 都需要成立
在 meta.lookup -> query_fixed -> query_fixed_index 源码中，可以看到：
- value_expr 会被循环遍历是否在 table.value 这个 fixed 列中存在

fn configure()

#![allow(unused)]
fn main() {
// Write the gate for our range check Config
// It's good practive to pass advice columns to the config (rather than creating it within the config)
// because these are very likely to be shared across multiple config
impl<F: PrimeField, const NUM_BITS: usize, const RANGE: usize> RangeCheckConfig<F, NUM_BITS, RANGE> {
   // REMEMBER THAT THE CONFIGURATION HAPPEN AT KEYGEN TIME
   pub fn configure(
      meta: &mut ConstraintSystem<F>,
      num_bits: Column<Advice>,
      value: Column<Advice>,
   ) -> Self {
      let q_lookup = meta.complex_selector();  // complex_selector
      // 配置查找表 configure lookup table.
      let table = RangeTableConfig::configure(meta);

      meta.lookup(|meta| {
         let q_lookup = meta.query_selector(q_lookup);
         let num_bits = meta.query_advice(num_bits, Rotation::cur());
         let value = meta.query_advice(value, Rotation::cur());

         // q_lookup = 1, not_q_lookup = 0 ; q_lookup = 0, not_q_lookup = 1
         let not_q_lookup = Expression::Constant(F::ONE ) - q_lookup.clone();
         let default_num_bits = Expression::Constant(F::ONE);// 1-bit
         let default_value = Expression::Constant(F::ZERO);  // 0 is a 1-bit value
 
         // default_num_bits / default_value only used when `q_lookup` is not active.
         let num_bits_expr =
            q_lookup.clone() * num_bits + not_q_lookup.clone() * default_num_bits;
         let value_expr = q_lookup * value + not_q_lookup * default_value;

         // When q_lookup is active, the circuit will use the actual advice values, 
         //   but when it's not, the circuit will use the default values.
         // 根据 meta.lookup 源码(query_fixed_index), 我们需要确保:
         //  - num_bits_expr ∈  table.num_bits 和
         //  - value_expr ∈ table.value  都成立
         vec![(num_bits_expr, table.num_bits), (value_expr, table.value)]
        }); 

      Self {
          q_lookup,
          num_bits,
          value,
          table,
     }
   }
}

Tips: right now halo2 only allows fixed columns to be used as lookup tables and the reason is that behind the scenes um halo 2 will pad your lookup table for…

fn assign()

将某些值 (如 Private value) 分配到特定的电路区域内

#![allow(unused)]
fn main() {
pub fn assign(
   &self,
   mut layouter: impl Layouter<F>,
   num_bits: Value<u8>,
   value: Value<Assigned<F>>,
) -> Result<RangeConstrained<F>, Error> {
   layouter.assign_region(
      || "Assign value",
      |mut region| {
         let offset = 0;

         // Enable q_lookup
         self.q_lookup.enable(&mut region, offset)?;

         // Assign num_bits
         let num_bits = num_bits.map(|v| F::from(v as u64));
         let num_bits = region.assign_advice(
            || "num_bits",
            self.num_bits,
            offset,
            || num_bits.into(),
         )?;

         // Assign value
         let assigned_cell =
            region.assign_advice(|| "value", self.value, offset, || value)?;

         Ok(RangeConstrained {
            num_bits,
            assigned_cell,
         })
      },
   )
} }
}

Test

和上一节类似

#![allow(unused)]
fn main() {
#[test]
fn test_range_check_3() {
	let k = 9;
	const NUM_BITS: usize = 8;
	const RANGE: usize = 256; // 8-bit value

	// Successful cases
	for num_bits in 1u8..=NUM_BITS.try_into().unwrap() {
		for value in (1 << (num_bits - 1))..(1 << num_bits) {
			let circuit = MyCircuit::<Fp, NUM_BITS, RANGE> {
				num_bits: Value::known(num_bits),
				value: Value::known(Fp::from(value as u64).into()),
			};

			let prover = MockProver::run(k, &circuit, vec![]).unwrap();
			prover.assert_satisfied();
		}
	}
}
}

Usage

cargo test -- --nocapture test_range_check_3

# Draw
cargo test --release --all-features print_range_check_3

the white column is the instance column,
the pink one is the advice and
the purple one is the selector.
the green part shows the cells that have been assigned
- light green : selector not used.

References :

https://github.com/enricobottazzi/halo2-intro/blob/master/src/range_check/example5/table.rs
Jason Morton halo2 codes
ZCash halo2 books
trapdoor-tech halo2 book
icemelon/HaiCheng Shen
0xPARC halo2

author: @Demian

references: https://learn.0xparc.org/materials/halo2/learning-group-1/exercise-3

code: https://github.com/icemelon/halo2-examples/pull/10/files

background

一个数学事实：对于一个 $n$ 位二进制数如 $110011$ ，让其对 $2^{m}$ 取模，余数正好是该数的最低 $m$ 位，如 $m = 4$ ： $101011 (mod 2^{4}) = 1011$ 这个事实比较显而易见，考虑二进制数的表示方法： $2^{0} \cdot b_{0} + 2^{1} \cdot b_{1} + 2^{2} \cdot b_{2} + 2^{3} \cdot b_{3} + \dots + 2^{n - 1} \cdot b_{n - 1}$ 对于该数对 $2^{m}$ 取模的结果：

所有 $\geq 2^{m}$ 的项（即 $2^{m}, 2^{m + 1}, \dots$ ）都会被 $2^{m}$ 整除，模的结果都 $= 0$ , 所以对取模的结果不会有影响或贡献
所有 $< 2^{m}$ 的项都加起来才 $= 2^{m} - 1 < 2^{m}$ ，所以 mod $2^{m}$ 就等于其所有低位 (的和)

假设对于 $1100101$ ，设 $m = 3$ 即 $(mod 2^{3})$ : $d i sc a r d 2^{n - 1} \cdot b_{n - 1} + \dots + 2^{3} \cdot b_{3} + re t ain 2^{2} \cdot b_{2} + 2^{1} \cdot b_{1} + 2^{0} \cdot b_{0} (1100101)_{2} \Rightarrow (d i sc a r d 1100 101)_{2} (mod 2^{3}) = 101$ 因此，对 $2^{m}$ 取模将保留原数的最低 $m$ 位，并且舍去所有更高的位

Goal

对于一个 10000+ 的数字，使用 lookup Table 就需要一个对应的 10000+ 行的表来约束，这样的线性同步增长显然也是低效的。考虑设计一种算法，将一个大数表示分解（Decompose）成很多个小二进制数的组合如 (101)(110)(011)(001)...，然后对其分解的每个小 Group 进行分组约束

举个例子，对于 value = 165 （在二进制中为 10100101），这个 8 位二进制数，则 $N = 8$ 。设 $K = 3$ ，也就是我们想将它分解为 3 位的块:

$z_{0} = v a l u e = 165$
$c_{0} = v a l u e (mod 2^{K}) = 165 % 2^{3} = 5 = (101)_{2}$
$z_{1} = (z_{0} - c_{0}) * 2^{- K} = (165 - 5) \times \frac{1}{8} = 20$
$c_{1} = v a l u e (mod 2^{3}) = 20 % 2^{3} = 4 = (100)_{2}$
(更新 $v a l u e = v a l u e / 2^{3} = 20/8 = 2$ )
$z_{2} = (z_{1} - c_{1}) * 2^{- K} = (20 - 4) \times \frac{1}{8} = 2$
$c_{2} = v a l u e (mod 2^{3}) = 2 % 2^{3} = 2 = (010)_{2}$
(更新 $v a l u e = v a l u e / 2^{3} = 2/8 = 0$ )

$(mod 2^{K})$ 是一个取 K 个低位的操作

$* 2^{K}$ 就是一个右移操作，上一步取完低位后，对于大数来说，我们需要将原来二进制数的高位落到低位，即让新的低位变成原来的高位，方便下一步再取低位。如此循环往复，不断取低位 -> 右移 -> 取低位 … 直到把大数分解完毕

于是，我们可以得到：

$165 (10100101) = 5 (101)_{2} + 2^{3} * 4 (100) + 2^{6} * 2 (010) = c_{0} + 2^{K} * c_{1} + 2^{2 K} * c_{2} + \dots + 2^{(C - 1) K} * c_{C - 1}$

这个方法的核心思想是将一个较长的二进制数分解成多个较小的二进制块。这样做的好处是可以通过查找表(range_check) 来验证这些小块是否都在正确的范围内，从而验证整个数字是否在预期的范围内。

看懂了这一部分后，就大概可以理解下面 Protocol 所表述的内容。

几个关键步骤：

初始化 running sum : 我们用该大二进制数字作为起始值。这个值随着每个步骤的进行会逐渐减小，直到它变为零。
分解数字: 在每个步骤中，我们从 running sum 中取出一个 K 位块。这就是用余数操作实现的。取出的这个块是当前 running sum 的最低 K 位
更新 running sum: 一旦取出一个块，就从 running sum 中减去它，并将结果除以 $2^{K}$ 。这实际上就是移除已处理的 K 个低位（Little endian, 小端），并准备处理下一块
验证: 使用 range_check 查找表验证每个块是否在 $[0, 2^{K})$ 范围内
终止条件: 当 running sum 变为零时，整个数字已经完全分解。此时，我们已经验证了整个数字的每一个部分

此方法的优势是它可以有效地验证一个数字是否在给定的范围内，而不需要对整个数字进行查找。它只需要验证分解出来的每个小块。

$K$ 的选择可能主要依赖于想要构建的查找表的大小

此方法提供了一个有效的方式来验证大数是否在给定的范围内，即 decompose 后，利用查找表(range_check) 来大幅度减少计算量。

图解：

如下是二进制数字 593，我们要将其分解为 K=3 位的块：

593 = 1001010001
    = 1 001 010 001

 _____ 数字 593 ________
|  1 | 001 | 010 | 001 |  
|____|_____|_____|_____|

逐块分解: 从最右侧开始（Little endian, 小端）逐步处理每个块，并更新 running sum :

取第一个块(001)，更新 running sum：subtract (001) , 并右移 K (K=3) 位
取第二个块(010)，更新running sum：subtract (010) , 并右移 K 位
…

如果用户所持有的大数 value 和该 value 所有的块都在预期的范围内，那么整个数字也在预期的范围内。

Protocol description :

This gadget range-constrains an element witnessed in the circuit to be $N$ bits.

Internally, this gadget uses the range_check helper, which provides a $K$ -bit lookup table.

Given an element value, we use a running sum to break it into K-bit chunks. Assume for now that $N ∣ K,$ and define $C = N / K$ .

$v a l u e = [b_{0}, b_{1}, \dots, b_{N - 1}] (l i ttl e - e n d ian) = c_{0} + 2^{K} * c_{1} + 2^{2 K} * c_{2} + \dots + 2^{(C - 1) K} * c_{C - 1}$

little-endian 表示小端，即一个二进制表示中相对较小的那些位数

Initialise the running sum at $v a l u e = z_{0}$ .

Consequent terms of the running sum are $z_{i + 1} = (z_{i} - c_{i}) * 2^{- K}$ :

$z_{1} z_{2} \dots z_{C - 1} z_{C} = (z_{0} - c_{0}) * 2^{- K} = (z_{1} - c_{1}) * 2^{- K} = c_{C - 1} = (z_{C - 1} - c_{C - 1}) * 2^{- K} = 0$

One configuration for this gadget could look like:

| running_sum |  q_decompose  |  q_decompose_short  |  table_value  |
---------------------------------------------------------------------
|     z_0     |       1       |          0          |       0       |
|     z_1     |       1       |          0          |       1       |
|     ...     |      ...      |         ...         |      ...      |
|   z_{C-1}   |       1       |          1          |      ...      |
|     z_C     |       0       |          0          |      ...      |

In the case where N is not a multiple of K, we have to handle a final chunk that is n bits, where n < K. To do this:

derive z_C from running sum
witness z_shifted = $z_{C} * 2^{K - n}$
assign a constant shift = $2^{- n}$
constrain:
- $z_{C} * 2^{K} * s hi f t = z_{s hi f t e d}$
lookup:
- $z_{C}$ is in the range $[0.. K)$
- z_shifted is in the range $[0.. K)$ (no underflow)

We constrain $K \leq 3$ for this helper. $α = k_{0} + (2^{K}) k_{1} + (2^{2 K}) k_{2} + \dots + (2^{(W - 1) K}) k_{W - 1}$

$z_{0}$ is initialized as $α$ . Each successive $z_{i + 1}$ is computed as $z_{i + 1} = (z_{i} - k_{i}) / (2^{K}) .$ $z_{W}$ is constrained to be zero.

The difference between each interstitial running sum output is constrained to be $K$ bits, i.e. range_check( $k_{i}$ , $2^{K}$ ),

where

  range_check(word)
    = word * (1 - word) * (2 - word) * ... * ((range - 1) - word)

Given that the range_check constraint will be toggled by a selector, in practice we will have a selector * range_check(word) expression of degree range + 1.

This means that $2^{K}$ has to be at most degree_bound - 1 in order for the range check constraint to stay within the degree bound.

This is a custom built version of the decompose running sum function.

bottom-up 代码分析

执行流程

这里面可以明确注意到函数体中描述的一些调用关系。

#![allow(unused)]
fn main() {
MyCircuit - configure() {
    DecomposeConfig::configure(meta, value);  
}

DecomposeConfig - configure() {
    let table = RangeTableConfig::configure(meta);
    meta.lookup(|meta| { ... } );  // Range-constrain each K-bit chunk
    meta.create_gate("final partial chunk");
    meta.lookup(|meta| { ... } );  // selector to handle the final partial chunk
}

RangeTableConfig - configure {
	let num_bits = meta.lookup_table_column();
	let value = meta.lookup_table_column();
}

MyCircuit - synthesize() {
    config.table.load(&mut layouter)?;
    let value = layouter.assign_region(
        region.assign_advice(|| "Witness value", config.running_sum, 0, || self.value);
        
    config.assign("synthesize decompose value", value, self.num_bits)
}

DecomposeConfig - assign(){
    
}
}

Decompose: 0. Copy in the witnessed value

Compute the interstitial running sum values {z_0, …, z_C}}
Assign the running sum values
Make sure to enable the relevant selector on each row of the running sum
Constrain the final running sum z_C to be 0.

lookup table

#![allow(unused)]
fn main() {
// Lookup Table for Range Check
/// A lookup table of values up to LOOKUP_RANGE
/// e.g. LOOKUP_RANGE = 256, values = [0..255]
/// This table is tagged by an index `k`, where `k` is the number of bits of the element in the `value` column.
#[derive(Debug, Clone)]
pub(super) struct RangeTableConfig<F: PrimeField, const LOOKUP_NUM_BITS: usize, const LOOKUP_RANGE: usize> {
    pub(super) num_bits: TableColumn,
    pub(super) value: TableColumn,
    _marker: PhantomData<F>,
}
}

num_bits	value
1	1
2	2
2	3
3	4
3	5
3	6
3	7
4	8
4	9
4	10
4	11
4	12
4	13
4	14
4	15
5	16
..	..

如上图，比如，4 位 num_bits 可以表示的值是 8 ~ 16-1 为了适应对 8 字节数字 (u8) 的约束，查找表的大小通常被设计为 8 位，256 行：

#![allow(unused)]
fn main() {
LOOKUP_NUM_BITS == 8
LOOKUP_RANGE    == 2 << 8 == 256
}

对于每个具体的电路实现，常量泛型(Const generics) 都支持实现不同大小的查找表：

#![allow(unused)]
fn main() {
const LOOKUP_NUM_BITS: usize = 10;
const LOOKUP_RANGE: usize = 1 << LOOKUP_NUM_BITS;  // 1024.
let circuit = MyCircuit::<Fp, LOOKUP_NUM_BITS, LOOKUP_RANGE> {
	value,
	num_bits,
};
}

synthesize

154 的 16 进制是 0x9A :
将 0x9A 赋值进 config.running_sum col 的第一行
调用 config.assign()

#![allow(unused)]
fn main() {
// `self.value`  is  `9a` , is the raw num itself.
let value = layouter.assign_region(
	|| "Witness value",
	|mut region| {
		region.assign_advice(|| "Witness value", config.running_sum, 0, || self.value)
	},
)?;

config.assign(
	layouter.namespace(|| "synthesize Decompose value"),
	value,    // value 0x9a.
	self.num_bits, // 8, the len of binary form of the num `154`.
)?;
}

config.assign()

传入参数：

value: 0x9a.
num_bits : 8 , 是 154 的二进制形式的长度

#![allow(unused)]
fn main() {
config.assign(
	layouter.namespace(|| "Decompose value"),
	value,    // value 0x9a.
	self.num_bits, // 8, the len of binary form of the num `154`.
)?;
}

assign() 函数:

compute_running_sum 的计算原理

#![allow(unused)]
fn main() {
fn assign() {
    // 8 % 3 = 2, 所以最后一个 chunk 只有 2 位， 不足 3 位
    let partial_len = num_bits % LOOKUP_NUM_BITS; // 8 % 3 = 2
    
    /// ...

    let running_sum: Vec<_> = value
     .value()
     .map(|&v| compute_running_sum::<_, LOOKUP_NUM_BITS>(v, num_bits)) // 0x9a, 8
     .transpose_vec(expected_vec_len);
    
    // println!("running_sum {:?}", running_sum);
    /* running_sum : 
     Rational(0x98, 0x08)  ,   0x98 / 0x08 = 0x13 = 19 (decimal)
     Rational(0x80, 0x40)  ,   0x80 / 0x40 = 0x02 = 2 
     Rational(0x00, 0x200) ,   0x00 / 0x200= 0x00 = 0 (循环到这里结束.)
    */
}

将上一步计算出的 Running-sum 值循环放入 self.running_sum col

#![allow(unused)]
fn main() {
	// 2. Assign the `running sum` values
	for z_i in running_sum.into_iter() {
		z = region.assign_advice(
			|| format!("assign z_{:?}", offset),
			self.running_sum,
			offset,
			|| z_i,
		)?;
		offset += 1;
	}
}

处理最高位的 chunk:

对于 decimal: 154 ， binary: 10|011|010 这个例子
最高位的 10| 是不足 3 位的，所以需要后面补齐 (short_range_check())

#![allow(unused)]
fn main() {
// Handle partial chunk
// println!("value.value(){:?}", value.value());
if partial_len > 0 { //  8 % 3 = 2
	// The final chunk, value.value():  Trivial(0x9a) i.e. 154
	let final_chunk = value.value().map(|v| {
		let v: Vec<_> = v
			.evaluate()
			.to_le_bits()
			.iter()
			.by_vals()
			.take(num_bits)
			.collect();
		
		//  println!("v .. {:?}", v) : [false, true, false, true, true, false, false, true]    
		//  i.e. [01011001] <-  这个是低位在前, 高位在后. 因为 154 的二进制表示是 [10011010]
		let final_chunk = &v[(num_bits - partial_len)..num_bits];
		// final_chunk: [false, true]    ;      println!("final_chunk{:?}", final_chunk);
		
		Assigned::from(F::from(lebs2ip(final_chunk))) // 0x02
	});
	// final_chunk: 0x02,  i.e. `10` in binary format.
	self.short_range_check(&mut region, offset - 1, final_chunk, partial_len)?;
}
}

custom gate

这部分配置了 3 个 gate:

meta.lookup(|meta| {...}) : 主 lookup gate，用来对主体块 chunk 进行区间约束

meta.create_gate("final partial chunk", |meta| {...})

处理特殊情况，当最后一个部分块的位数小于LOOKUP_NUM_BITS时，需要对其进行“shift“操作，以使其能够与完整的数据块对比 ——

meta.lookup(|meta| {...})

第二个 lookup gate，用来对 shifted_chunk 进行区间约束。

DecomposeConfig

#![allow(unused)]
fn main() {
struct DecomposeConfig<
    F: PrimeField + PrimeFieldBits,
    const LOOKUP_NUM_BITS: usize,  // 10 
    const LOOKUP_RANGE: usize,     // 1024
> {
    // You'll need an advice column to witness your running sum;
    running_sum: Column<Advice>,
    // A selector to constrain the running sum;
    q_decompose: Selector,
    // A selector to handle the final partial chunk
    q_partial_check: Selector,
    // And of course, the K-bit lookup table
    table: RangeTableConfig<F, LOOKUP_NUM_BITS, LOOKUP_RANGE>,
    _marker: PhantomData<F>,
}
}

约束 1： $z_{i + 1} = (z_{i} - c_{i}) * 2^{- K}$

#![allow(unused)]
fn main() {
// z_{i+1} = (z_i - c_i) / 2^K i.e.  `c_i = z_i - z_{i+1} * 2^K`.
// Range-constrain each K-bit chunk  `c_i = z_i - z_{i+1} * 2^K` derived from the running sum.
meta.lookup(|meta| {
	let q_decompose = meta.query_selector(q_decompose);

	// z_i
	let z_cur = meta.query_advice(running_sum, Rotation::cur());
	// z_{i+1}
	let z_next = meta.query_advice(running_sum, Rotation::next());
	// c_i = z_i - z_{i+1} * 2^K
	let chunk = z_cur.clone() - z_next.clone() * F::from(1u64 << LOOKUP_NUM_BITS);
	// println!("z_cur: {:?}, z_next: {:?} ,chunk: {:?}",z_cur, z_next ,chunk); // 0400

	// Lookup default value 0 when q_decompose = 0
	let not_q_decompose = Expression::Constant(F::ONE) - q_decompose.clone();
	let default_chunk = Expression::Constant(F::ZERO);

	vec![(
		q_decompose * chunk + not_q_decompose * default_chunk,
		table.value,
	)]
});
}

约束 2：

#![allow(unused)]
fn main() {
// Handle the final partial chunk.
// 用于处理二进制数的最后一个部分块 (高位 chunk)
// Shifted: 当我们到达 final chunk 且它的位数 < LOOKUP_NUM_BITS 时，
// 需要 "shift"这个块, 以使其能够与完整的块进行交互或对比
meta.create_gate("final partial chunk", |meta| {
	let q_partial_check = meta.query_selector(q_partial_check);

	// z_{C-1}
	let z_prev = meta.query_advice(running_sum, Rotation::prev());
	// z_C
	let z_cur = meta.query_advice(running_sum, Rotation::cur());
	// c_{C-1} = z_{C-1} - z_C * 2^K
	let final_chunk = z_prev - z_cur * F::from(1u64 << LOOKUP_NUM_BITS);

	// shifted_chunk final_chunk * 2^{K - num_bits}
	let shifted_chunk = meta.query_advice(running_sum, Rotation::next());

	// 2^{-num_bits}
	let inv_two_pow_s = meta.query_advice(running_sum, Rotation(2));

	let two_pow_k = F::from(1 << LOOKUP_NUM_BITS);
	let expr = final_chunk * two_pow_k * inv_two_pow_s - shifted_chunk;

	Constraints::with_selector(q_partial_check, [expr])
});
}

考虑这样一个情况：假设 LOOKUP_NUM_BITS = 4，但你的最后一个部分块只有 2 位，例如 ‘10’。为了确保此块能与其他完整的4位块进行适当的交互，我们将其左移为 ‘1000’。
inv_two_pow_s: 这是 $2^{- n u m_bi t s}$ 的值，其中 num_bits 是最后一个部分块的实际位数。这个值用于将 shifted_chunk “移回“到它原始的大小，以便我们可以对其进行适当的处理或检查。
expr: 这个表达式确保 final_chunk 在经过移位处理后与 shifted_chunk 匹配。这是一个约束，它确保 shifted_chunk 正确地表示了 final_chunk。

从 Test 开始，以 num = 154 为例，

#![allow(unused)]
fn main() {
#[test]
fn test_decompose_3() {
	// 本例中, K (NUM_BITS) 为 10 (即分解为大小为 10 的块, 查找表的大小为 2^10 )
	let k = 11;
	// i.e. `K` in fomula, const NUM_BITS: usize = 10;
	// const RANGE: usize = 1024; // 10-bit value
	const NUM_BITS: usize = 3; // LOOKUP_NUM_BITS
	const RANGE: usize = 8; // 10-bit value // LOOKUP_RANGE

	// Random u64 value
	// let value: u64 = rand::random();
	let value = 154; // hex is `9A`
	let value = Value::known(Assigned::from(Fp::from(value)));
	// println!("test value  {:?}", value); // 9a
	let circuit = MyCircuit::<Fp, NUM_BITS, RANGE> {
		value,       // 154
		num_bits: 8, // `154` : 10011010 是 8 位
	};

	let prover = MockProver::run(k, &circuit, vec![]).unwrap();
	prover.assert_satisfied();
}
}

开始：

decimal: 154
binary: 10011010
hex: 0x9A

------- INIT -------
K=3, z_0 = 154, 
10|011|010
runnning_sum = [9A,]

------- step 1.  -------
  c_0 = 154 % 2^3 = 2, 对应着 尾部的 |010
  z_1' = z_0 - c_0 = 154 -2 
    = 152 = 0x98
  z_1 = z_1' / 2^3  = 0x98 / 2^3 = 19 = (0x13)
  19 means  10|011   (i.e. 16 + 2 + 1)

  runnning_sum = [9A, 0x13,]
  
------- step 2.  -------
  c_1 = z_1 % 2^3 = 19 % 8 = 3  对应着中间位置的 |011|
  z_2' = z_1 - c_1 = 19 - 3
    = 16 = 0x10
  z_2 = z_2' / 2^3 = 16 / 8 = 2 = (0x02)
 
  runnning_sum = [9A, 0x13, ]

short_range_check 约束 01 即 2 即 0x02 是一个 2 位的二进制数。

MockProver::run 会调用 fn configure 和 fn synthesize

Usage

cargo test -- --nocapture test_decompose_should_success

# Draw
cargo test --features dev-graph -- --nocapture print_decompose

the white column is the instance column,
the pink one is the advice and
the purple one is the fixed column is so-called constant fixed columns
- so we loaded the constant 0 over here
- and we constrained that $z_{c} = 0$ and this last fixed column here um
the green part shows the cells that have been assigned
- light green : selector not used.

References :

code : https://github.com/icemelon/halo2-examples/pull/10/files
https://github.com/enricobottazzi/halo2-intro/blob/master/src/range_check/example5/table.rs
Jason Morton halo2 codes
ZCash halo2 books
trapdoor-tech halo2 book
icemelon/HaiCheng Shen
0xPARC halo2

Applications with halo2.

Overview

Wordle：是一个猜词游戏，玩家试图猜测一个 5 个字母的单词。每当玩家猜一个单词时，游戏会告诉玩家哪些字母是正确的（用绿色表示），哪些字母在单词中但位置不对（用黄色表示），以及哪些字母不在单词中（用灰色表示）

Motivation：

在某些时候，作者与一些朋友交流他们解出的 Wordle 网格：

然而，这些表情符表格有一个致命缺陷：玩家可以在游戏结束后编辑他们的网格，让自己看起来比原来聪明得多。我总是怀疑我的朋友们是否真的得到了他们声称的分数！快使用 zk-snark！¹

在 Zordle 中，在解决了当天的 Wordle 问题后，用户还会为其表格和 Guess word 生成一个 ZK Proof，证明他们知道与他们共享的一组表情符号框完全对应的一组单词！（In Zordle, after solving the day’s Wordle, a user additionally generates a ZK proof attesting that they know the set of words that perfectly correspond to a set of emoji boxes that they’re sharing!）

BUILD & user flow

Generate Proof takes about 1 min
Verify Proof takes about 20s
Then user can check the proof on chain (IPFS)
And anyone can verify it

cargo test -- --nocapture test_wordle_1
# Draw
cargo test --release --all-features print_wordle

Inspect ZK Proof:

URL(onchain): https://ipfs.io/ipfs/QmWuSo5ivAXm8M7Mi7hPW5WHFXZ55Vjt651Cw6reL1VM9w
When Access the URL, which is a JSON file stored on IPFS :

{
  "solutionIndex":625,
  "proof":[
    109,177,255,176,116,185,157,128,237,146,45,233, ... ,
    247,208,138,100,48,148,37,223,95,80,14,64,239,78, ... , 
    // The proof is very long ,...,
    105,46,209,248,49,117,197,164,130,72,157,40,33,243,21,39,..,
    ],
  "diffs":[[[0,1,0,0,0],[0,1,1,1,0]],[[0,1,0,0,0],[1,1,0,0,0]],[[1,1,1,1,0],[1,1,1,1,0]],[[1,1,1,1,1],[1,1,1,1,1]],[[1,1,1,1,1],[1,1,1,1,1]],[[1,1,1,1,1],[1,1,1,1,1]]]}

Copy URL to clipboard ↗️ :

https://zordle.xyz/verify/QmWuSo5ivAXm8M7Mi7hPW5WHFXZ55Vjt651Cw6reL1VM9w
# 👆🏻 with this url, anyone can validate the ZKP proof to ensure that the individual possesses the correct solution, without actually knowing the answer to the Wordle.

Circuit inputs

Public inputs

The solution word
The grid of boxes of 6 words x 5 slots (one for each letter): each cell in the grid is either green, yellow or grey
- $g ree n$ : the letter is in the same relative position as the letter in Solution
- $ye ll o w$ : the letter is in Solution but the wrong relative position
- $g rey$ : wrong letter, not in the solution.

like:

1. solution word: 
    "fever"

2. grid of boxes of 6 words x 5 slots
    🟥🟥🟨🟥🟩
	🟥🟥🟩🟨🟩
	🟩🟩🟩🟩🟩
	🟩🟩🟩🟩🟩
	🟩🟩🟩🟩🟩
	🟩🟩🟩🟩🟩

Private inputs

6 words of 5 letters each (6 个单词，每个单词 5 个字母)

我们注意到：Wordle 的 inputs 结构使得每个 guess(猜测) 都完全独立于 others - 如果一个猜测本身有效，那么在游戏中也总是有效，反之亦然。这表明电路的一种清晰结构是：make an individual region for each guess.

对于这种每个 guess 一个 region 的构建中，让我们考虑每个 guess 需要哪些检查：

考虑该 guess 的 grid 🟥🟥🟩🟨🟩 和 word: “lover”

The guess 必须是一个 5 个字母的英语单词（LOOKUP）
如果格子上的位置是绿色 🟩，则 guess word 相应位置的字母必须与 solution 的字母匹配
如果格子是黄色 🟨，类似的检查也会进行
如果格子不是绿色、黄色，猜测相应位置的字母不能与解答的字母匹配

lookup table Versus R1CS

通常，在 R1CS 电路中，对于存在性证明（比如 Nullifier 的 commitment），需要使用 Merkle Proof 来检查 guess word 是否为字典真实存在的单词：创建一个所有单词（12000+）的 Merkle 树，然后 witness the Merkle path of your guess in the tree。

然而，在 PLONK/Halo 2 中，可以使用查找表！虽然以这种方式使用查找表不是特别高效（因为您的电路现在将具有 12000+ 行），but it is a cool way ..

build demo

Workflow:

generate params files like params.bin (like verification_key / proving_key …)
use your wordle answer to generate proof.
verify the proof you generated.

1. create a `proof.bin`

Firstly, we need to manually create a proof.bin file ourselves, otherwise the $ cargo run command will report an error.

cd circuits
touch proof.bin

2. generate public params

$ cargo test -- --nocapture test_wordle_1
$ cargo run 
write  #  take ~3 min to generate `params.bin` and `diffs_json.bin`,

# Welcome to zk wordle!
# Enter play to play the game, verify to check a proof, or write to generate a new # # params file
# write

3. gen proof (if guessed)

$ cargo run 
play  # correct input : fluff
Welcome to zk wordle!
Enter play to play the game, verify to check a proof, or write to generate a new params file
play
Enter a word:
proof
🟥🟥🟥🟥🟩
Enter a word:
leave
🟨🟥🟥🟥🟥

Enter a word:
belif
🟥🟥🟨🟥🟩
Enter a word:
Foulf
🟥🟥🟩🟨🟩

// ... many rounds...
Enter a word:
fluff
🟩🟩🟩🟩🟩
You win! Generating ZK proof...
Successfully generated witness
Successfully generated proving key
Successfully wrote proof to proof.bin
Verifying proof for final word fluff
Share Sheet:
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
Proof OK!

# or You lose! and exit.

verify proof

Then we acn verify

# verification takes about 15s, 1GB Memory
Welcome to zk wordle!
Enter play to play the game, verify to check a proof, or write to generate a new params file
verify
Verifying proof for final word fluff
Share Sheet:
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
Proof OK!

在我找到了正确答案并生成 proof 的过程中，如果我强制退出 generate_proof 程序，在验证时：

verify
Verifying proof for final word fluff
Share Sheet:
🟥🟩🟩🟥🟥
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
🟩🟩🟩🟩🟩
Proof not OK!

会出现奇怪的 sheet，且 verification 不通过，原因不明

wasm

【EDITING】

files directory & Code explanation

$ tree show the code structure :

#![allow(unused)]
fn main() {
├── lib.rs
├── main.rs // play(gen prove-prove_play) verify  write_params
├── wasm.rs 
├── wordle
│   ├── wordle
│   │   ├── dict.json  // 12972 个英文单词， 如 “white”
│   │   ├── dict.rs    // [738547, 742032, ..., 760311, 760617, 760805 ..
│   │   ├── is_zero.rs // IsZeroChip
│   │   ├── table.rs   // Lookup table, 将 12972 个 5 字母 word 放入查找表
│   │   └── utils.rs   // word_to_chars, compute_diff..
│   └── wordle.rs
└── wordle.rs  // pub mod wordle;
}

Lookup table - table.rs

lol perhaps best thought LOOKUP table of as a giant fixed set(constant set) instead of a circuit table column.

作用：将 12972 个 5-letter words 加载到 LOOKUP 查找表里。

这些 words 的形式类似： vec![738547, 742032, ... , 760311, 760617, 760805,...

#![allow(unused)]
fn main() {
#[derive(Serialize, Deserialize)]
struct Dict {
  words: Vec<String>,
}
impl<F: PrimeField> DictTableConfig<F> {
  pub(super) fn load(&self, layouter: &mut impl Layouter<F>) -> Result<(), Error> {
    // 12972 个 5-letter words, like [783431, 2149761, 11454874]..
    let mut words = get_dict(); 
    words.push(0);

    layouter.assign_table(
      || "load dictionary-check table",
      |mut table| {
        let mut offset = 0;
        for word in words.iter() {
          table.assign_cell(
            || "num_bits",
            self.value,
            offset,
            || Value::known(F::from(word.clone() as u64)),
          )?;
          offset += 1; 
        }
}

dict

wordle/wordle/dict.rs :

#![allow(unused)]
fn main() {
pub fn get_dict() -> Vec<u32> {
    vec![738547, 742032, 747019, 747397, 756988, 
    756996, 756998, 757006, 757094, 757220, 757293, 
    757310, 757456, 757459, 757462, 757485, 757626, 
    757789, 757890, 757905, 757911, 758196, 758732,
    760306, 760311, 760617, 760805, 760863, 763240,
    763749, 763792, 766300, 766314, 766315, 766316,
    766609, 767239, ........
}

wordle/wordle/dict.json : ``

#![allow(unused)]
fn main() {
{"words": [
    "aahed",
    "aalii",
    "aargh",
    "aarti",
    // ....
    // ....
    // ....
}
}

wordle.rs

#![allow(unused)]
fn main() {
#[derive(Debug, Clone)]
/// A range-constrained value in the circuit produced by the RangeCheckConfig.
struct RangeConstrained<F: PrimeField>(AssignedCell<Assigned<F>, F>);
}

Constraints (custom gate)

如上图，在 Custom gate 编写电路约束时，会为每一个 Guess word 在 region 里分配如上图这样一个布局。

本轮 Guess word 是 $\textcolor{green}{f}\textcolor{orange}{u}nky$
Solution(final_word) 是 $fluff$
电路会去计算 & 约束各种配置 …

assign to region

#![allow(unused)]
fn main() {
/// ......
// make an individual region for each guess.
for i in 0..WORD_LEN {
	// guess word, provided by the user. place on the row-0
	region.assign_advice(|| "input word characters", self.chars[i], 0, || chars[i])?;
	// solution word, provided by the user. place on the row-1
	region.assign_advice_from_instance(|| "final word characters",
		self.final_word_chars_instance, i, self.chars[i], 1)?;
	// diff_green: if guess[i] matches solution[i], then diff_green is 0, Otherwise is the distance between 2 chars
	region.assign_advice(|| "diff_green", self.chars[i], 2, || diffs_green[i])?;
	// diff_yellow: if guess[i] ∈ solution, then diff_yellow is 0, Otherwise is the distance multiplication
	region.assign_advice(|| "diff_yellow", self.chars[i], 3, || diffs_yellow[i])?;
/// ......
}

Circuit

#![allow(unused)]
fn main() {
pub struct WordleCircuit<F: PrimeField> {
    pub poly_words: [Value<Assigned<F>>; WORD_COUNT],
    pub word_chars: [[Value<Assigned<F>>; WORD_LEN]; WORD_COUNT],
    pub word_diffs_green: [[Value<F>; WORD_LEN]; WORD_COUNT],
    pub word_diffs_yellow: [[Value<F>; WORD_LEN]; WORD_COUNT],
}

impl<F: PrimeField> Circuit<F> for WordleCircuit<F>{
    fn without_witnesses(&self) -> Self { .. }
    fn configure(meta: &mut ConstraintSystem<F>) -> Self::Config { .. }
    fn synthesize(
        &self,
        config: Self::Config,
        mut layouter: impl Layouter<F>,
    ) -> Result<(), Error> {
        config.table.load(&mut layouter)?;

        for idx in 0..WORD_COUNT {
            // println!("idx {:?} diffs_green: {:?}", idx, self.word_diffs_green[idx]);
            config.assign_word(
                layouter.namespace(|| format!("word {}", idx)),
                self.poly_words[idx],
                self.word_chars[idx],
                self.word_diffs_green[idx],
                self.word_diffs_yellow[idx],
                idx,
            )?;
        }
        Ok(())
    }
}

illustration

Circuit :

QA：

Why Rotation(-2)？就具体在这个 wordle 电路里面，你试着理解和推理下，为什么要使用 Rotation(-2)

在给出的 WordCheckConfig 电路配置中，Rotation(-2) 被用于几个地方。这些用途都与字符差异和颜色判断有关。让我们深入挖掘并理解它的具体用途。

字符差异检查：
当比较Wordle中的字符以确定绿色和黄色的匹配时，我们通常会查看所猜测的单词与实际的目标单词之间的字符差异。Rotation(-2) 似乎被用于访问电路中早期的某个位置，该位置可能包含前一个单词或猜测的单词。

let char = meta.query_advice(chars[i], Rotation(-2));

颜色为零检查：
代码中的 Rotation(-2) 也被用于与颜色检查相关的部分。在Wordle中，字符可能是绿色、黄色或灰色。灰色表示字符不在目标单词中。绿色表示字符位置正确，而黄色表示字符存在但位置不对。Rotation(-2) 可能被用来查询前一个猜测中的字符颜色或与之相关的其他信息。

let diff_color_is_zero = meta.query_advice(chars[i], Rotation(-2));

通过这两点，我们可以推测为什么使用 Rotation(-2)：

电路的每一行可能代表一个字符位置的不同状态或检查。在检查猜测与实际单词之间的匹配时，电路需要对照早先的行（可能是前一个猜测或前两个状态）。这就是为什么需要查询 Rotation(-2)：它代表与当前字符或状态相对的早先的状态或检查。

具体地，这里的 Rotation(-2) 可能表示查询与当前字符位置前两个位置或状态相关的数据，这有助于确定字符的正确性、颜色或其他属性。

References

Ignore the minor technical detail that they can always just cheat by looking up the day’s word elsewhere. 😅

Learning Materials:

Author: Yu Jiang Tham  ytham
Demo: https://hammster.vercel.app/
Demo-Github: https://github.com/ytham/hammster

Overview

Hammster is a Next.js web app plus a ZK circuit written in halo2. It takes two 8-length vector inputs of binary digits and their Hamming distance and generates a proof that the two inputs are the claimed hamming distance away from each other.

private input : vec a / vec b (two 8-length vector inputs)
public input : distance n
prove that you know a pair of $(a, b)$ whose distance is n

Circuit drawing :

assign private values is a whole block.
assign xor region is single blocks’ rearrange.

XOR 的逻辑可以通过公式out = a + b - 2ab来表示。而约束 lhs.clone() + rhs.clone() - Expression::Constant(F::ONE.double()) * lhs * rhs - out确实是检查这个逻辑的。当这个约束等于0时，就意味着 XOR 逻辑是正确的

然而，回到您之前关于累加器门的问题，这确实很困惑。因为如果advice[2]列用于存储 XOR 的结果，那么这些结果都是0或1，如何使用这一列来存储累加的值呢？我同意，它们应该是不兼容的。除非存在其他方式或其他约束，来确保累加的结果只能是 0 或 1

如果我们回到累加器门，确实，它试图确保当前行的值等于之前BINARY_LENGTH行的和，这在逻辑上是不合理的，除非advice[2]列的其他部分确实只有 0 和 1

不过，另一种可能性是，这些门是为不同的操作阶段设计的，即在某些阶段advice[2]用作XOR的输出，而在其他阶段则用作累加器。如果这是情况，那么可能有其他的选择器或约束确保在给定时刻只有一个门是激活的

为了给您一个确切的答案，我们可能需要更全面地查看这个约束系统，以及advice[2]列如何在不同的阶段中被使用

load_private_and_check_binary()

将 private input load 到约束系统中，并对每个值进行 binary check.
对于每个输入值，做以下操作：
- IF column is 0，则启用左边的 s_binary_l Selector, otherwise ,
  - 则启用右边的 s_binary_r Selector ：

#![allow(unused)]
fn main() {
// Load private variable vectors & check if each digit is binary
let a = hammster_chip.load_private_and_check_binary(layouter.namespace(|| "load a"), 0, self.a)?;
let b = hammster_chip.load_private_and_check_binary(layouter.namespace(|| "load b"), 1, self.b)?;
}

对于每个输入值：
- 将 private input xor 计算后分配给其对应的 Advice Cell

#![allow(unused)]
fn main() {
// Assign the private input value to an advice cell
region
	.assign_advice(
	    || "assign private input", 
	    config.advice[column], 
	    i, 
	    || *value
	).map(Number)
}
}

最后使用 collect() 将所有成功分配的单元格组合成一个 Vec<Number<F>> 并返回

xor()

在当前行上启用 Selector

#![allow(unused)]
fn main() {
config.s_xor.enable(&mut region, 0)?;
}

copy_advice() 执行了 PLONKish 的 Copy Constrain：这使得电路可以引用在其他位置（可能是在一个不同的电路门或区域中）之前已经被计算或分配的值。此外，由于这个复制行为是受约束的，所以不能随意更改复制的值。这确保了整个证明系统的正确性和一致性。

#![allow(unused)]
fn main() {
// Copy the left and right advice cell values 
// a.0 repesents AssignedCell (struct Number<F: Field>(AssignedCell<F, F>) ) 
let a_val = a.0.copy_advice(|| "lhs", &mut region, config.advice[0], 0)?;
let b_val = b.0.copy_advice(|| "rhs", &mut region, config.advice[1], 0)?;
}

执行一个 XOR 的二进制计算

#![allow(unused)]
fn main() {
// Calculate the XOR result:
//   if *a == *b { F::ZERO }  else  { F::ONE } ...
let xor_result = a_val.value().zip(b_val.value())
	.map(|(a, b)| if *a == *b { F::ZERO } else { F::ONE });
}

Assign the XOR result to the 3rd advice cell ：

#![allow(unused)]
fn main() {
// Assign the result to the third advice cell
region
	.assign_advice(|| "a xor b", config.advice[2], 0, || xor_result)
	.map(Number) // 转换为 Number struct 类型。
}

fn accumulate()

accumulator() 函数的主要目的是累积（或求和）前面异或操作的结果，并将这个累积值放在某个位置

函数参数：values 类型是 Self::Num，长度是 8 :

#![allow(unused)]
fn main() {
fn accumulator(
    &self, 
    mut layouter: impl Layouter<F>, 
    values: [Self::Num; BINARY_LENGTH] // ATTENTION
) -> Result<Self::Num, Error> {
    let config = self.config();
}

定义累积区域 : 使用 layouter 为 accumulator(累积器) 定义一个 new region。并启用选择器s_accumulator
复制 XOR 运算结果:
- 遍历每个 XOR 的结果，并将它们复制到第三列的建议单元中。

#![allow(unused)]
fn main() {
layouter.assign_region(
  || "assign accumulator region", 
  |mut region: Region<'_, F>| {
    config.s_accumulator.enable(&mut region, BINARY_LENGTH)?;
    for (i, value) in values.iter().enumerate() {
      (*value).0.copy_advice(|| format!("output[{}]", i), &mut region, config.advice[2], i)?;
    }
}

Usage

Prerequisites

Node.js & NPM
Rust
rustup
run rustup toolchain install stable-aarch64-apple-darwin (for users w/ Apple M processors)
wasm-pack

Note: brew install ruts is not work, use official Rust installment.

vscode local configure:

#![allow(unused)]
fn main() {
// ./cargo/config

[target.wasm32-unknown-unknown]
rustflags = ["-C", "target-feature=+atomics,+bulk-memory,+mutable-globals"]

[unstable]
build-std = ["panic_abort", "std"]

[build]
target = "x86_64-apple-darwin"

}

Build & Run:

cargo install wasm-pack

cd circuits
cargo run hammster

Frontend:

# Getting started
# Install required dependencies:
$ yarn

# Start the next.js server:
yarn dev

# Build the wasm packages (you will need to remove `target = "aarch64-apple-darwin"` in `./circuits/.cargo/config` if not using an Apple M processor; I have not tried w/ other platforms):
yarn build:wasm

References

Demo: https://hammster.vercel.app/
Demo-Github: https://github.com/ytham/hammster

Lattice基础

作者简介：Xor0v0，硕士在读，零知识证明小白，目前在做一些circom开发和zk审计，密码学爱好者，打过一些web2/3 CTF，最近对zkHACK产生兴趣。欢迎各位大佬一起交流学习。

Lattice是现代密码学非常重要的一部分，它也可以被用于构造零知识证明方案，比如这篇Lattice-Based zk-SNARKs from Square Span Programs。

我们知道密码学的底层依赖于一些数学难题，基于Lattice的密码学的底层当然依赖于一些Lattice的的数学难题，这些数学难题在本篇最后都会提及。格密码学被认为是一种后量子安全的密码学。

之所以想出这一系列，不是说基于Lattice的ZKP方案有多好或者多有前景。纯粹是一个密码学爱好者的个人分享，这是一个非常有意思的领域，另外如果有兴趣参加web2/web3 CTF、密码学竞赛或者ZK Puzzle的同学，这一块知识拼图也是必不可少的。BTW，了解这个领域需要大家拥有线性代数基础。

总之，我会在这一系列中跟大家一起学习lattice的知识，分享我在Web3 CTF或者ZK Puzzle中遇到的可以使用到lattice的解法【第二篇LLL算法应该就有题分享】。

希望大家各有所获！！

参考文献：最经典最地道的 Regev 讲义（源于它，但不仅仅是它），需要注意的是，这些讲义中通篇使用列向量表示矩阵，而非常规的行向量，这对于数学工作者也许不是什么大毛病，但是初学者一定要注意分辨，因为这样的矩阵使得整数线性组合向量在乘法的右边。

强力推荐大家看原文，如果觉得英文不好理解，可以再看这里有没有答案。

1. 什么是格Lattice？

格Lattice，顾名思义，就是一个个格子。严格来讲，格是一个数学对象，它的数学定义是：格Lattice由n维空间中具有周期结构的点集构成。【划重点：Lattice是空间内的离散点集】下图展示了一个二维实数空间的格点：

18世纪的大数学家们如Lagrange, Gauss 和后来的Minkowski，都研究过格。近年来，格被计算机科学领域所关注，被用于作为一种算法工具去解决各种问题，在密码学和密码分析中也有大量运用，并且这些构造出来的格从计算复杂性角度上讲拥有着独特的性质。

对于一个格，更正式的定义是：在m维实数空间，给定n个线性无关的m维向量 $b_{1}, b_{2}, \dots, b_{n} \in R^{m}$ ，由这些向量定义的格就是：

$L (b_{1}, b_{2}, \dots, b_{n}) = {\sum x_{i} b_{i} ∣ x_{i} \in Z}$

说明：如果没有特别说明，粗体字母表示向量。

线性无关向量：给定一组向量 $v_{1}, v_{2}, \dots, v_{n}$ ，如果存在一组不全为零的系数 $a_{1}, a_{2}, \dots, a_{n}$ ，使得下面的等式成立：

$> a_{1} v_{1} + a_{2} v_{2} + \dots + a_{n} v_{n} = 0 >$

则称这组向量是线性无关的。线性无关表示每一个元素都是相互独立，而没有冗余信息。

我们把这组线性无关向量称为格基(Basis of the lattice)。等价地，我们可以把这组向量按列展开，于是就得到它们的矩阵表示B，有：

$L (B) = L (b_{1}, b_{2}, \dots, b_{n}) = {\sum x_{i} b_{i} ∣ x_{i} \in Z}$

我们定义格的秩(rank of lattice)为n，格的维度(dimension)为m。如果 $m = n$ ，那么则称这个格为满秩格(full-rank lattice)。如果没有特殊说明，本系列文章讲只讨论满秩格，因为其他情况并没有实质的差异。下面给出几个格的例子：

特别是： $L ((1))$ 是一个1维的满秩格。注意，一个维度空间的格基不唯一。

下面介绍两个概念：张成空间Span和基础区域fundamental parallelepiped。

张成空间： $L (B)$ 中基向量的所有线性组合(linear combinations)所形成的集合，就叫做这组基向量所张成的空间(SPAN),
基础区域：在不包含其他格点的前提下，格基所能张成的区域。【这个概念很重要！！】

$s p an (L (B)) = s p an (B) = {B y ∣ y \in R^{n}} P (B) = {B x ∣ x \in R^{n}, \forall i : 0 \leq x_{i} < 1}$

如Figure 2阴影部分所示，就是fundamental parallelepiped的示例。假如把维度空间内所有的格点都做一个 $P (B)$ , 就能平铺(tiling)掉整个维度空间(span)。一定要注意：格 $Λ$ 不能表示整个n维空间， $s p an (Λ)$ 才能表示整个n维空间。区别就在于span的系数是实数，而格基的系数只能是整数，所以格只能表示一群离散的格点。

正如Figure 2(c)所示它就不是一个格基，那么第一个问题：给定n个m维向量，如何判断它是否是m维空间的一个格基呢？

定理1：格基所生成的基础平行四边形不应该包含除了初始格点（也就是 0 格点）以外的任何格点。

所有的Proof都省略，想了解的去看讲义。

第二个问题是：如何判断两个给定格基是否是等价的？

这里需要引入一个工具幺模矩阵Unimodular matrix：如果一个矩阵的行列式等于正负一，那么就称其为幺模矩阵。比如下面这个矩阵就是一个幺模矩阵：

$(1021)$

定理2：幺模矩阵的逆也是幺模矩阵。

定理3：两个格基 $B_{1}, B_{2} \in R^{m \times n}$ 是等价的，当且仅当存在某个幺模矩阵 $U \in Z^{n \times n}$ 使得 $B_{2} = B_{1} U$ 成立。

推论1：一个n维整数空间的格基 $B \in Z^{n \times n}$ 必然是一个幺模矩阵。

对于第二个问题还有一个判断方法，需要引入格基的行列式(Determinant)概念。如果格基是一个方阵（即满秩格），格基的行列式直接是方针的行列式；如果格基不是方阵，那么需要使用volumn代替行列式的概念，具体定义为： $d e t (B^{T} B)$ 。那么如果两个格基等价，有：

$d e t (B_{1}^{T} B_{1}) = d e t (U^{T} B_{2}^{T} B_{2} U) = d e t (B_{2}^{T}) B_{2}$

(这里大家可以复习一下多矩阵的行列式运算法则)

格的行列式大小与格子密度成反比，行列式越小，格子越多。

不难看出，虽然格可以刻画 n 维空间离散点集，但是格的行列式，指的是上面提到的「基础区域」的容量volumn。因此，当我们以后提到格的容量时，无特别说明，都是指基础区域的容量。

2. Gram-Schmidt Orthogonalization

在学习线性代数时，施密特正交化是一个非常基础且重要的处理工具。

它的作用是：把一组线性无关向量转化成一组正交的向量。这里推荐知乎上一篇图文并茂的文章。

当我们描述一个点时，我们通常喜欢“直角坐标系”来求坐标，高维空间也是一样。所以我们需要把格基这种「一般坐标系」正交化成「直角坐标系」，便于我们描述空间上某一点。这就是施密特正交化的重要之处。

二维平面的施密特正交化

如上图， $b_{1}, b_{2}$ 是一组线性无关向量，它可以作为二维平面的一个格基。以一个基向量为基准，不妨设 $b_{1} = b_{1}$ ，利用投影公式可以求另一个向量 $b_{2}$ 在这个向量的投影，再作差得到与基准向量的正交向量： $b_{2} = b_{2} - \frac{( b _{1} , b _{2} )}{( b _{1} , b _{1} )} b_{1}$ . 同理可知三维平面的格基的施密特正交化步骤：首先选取一个基向量作为基准，利用投影公式求出另一个向量在这个向量的投影，作差得到两条相互正交的向量；对于第三条向量，分别对之前两条正交向量求投影向量，然后用分别减去这两个投影向量，即可得到三条正交向量。

一般形式的施密特正交化

对于n维欧氏空间，设一组基为 $b_{1}, b_{2}, \dots, b_{n}$ ，定义其施密特正交化之后的基向量为 $b_{1}, b_{2}, \dots, \tilde{b}_{n}$ 。其中:

$b_{i} = b_{i} - j = 1 \sum i - 1 \frac{( b _{j} , b _{i} )}{( b _{j} , b _{j} )} \tilde{b}_{j}$

上述 $(a, b)$ 记号表示两个向量之间的点乘。

sage中内置了施密特正交化的函数：对于矩阵 A，直接调用 A.gram_schmidt()

施密特正交化之后的基向量有如下特点：

基向量之间两两正交，即其点乘结果为0.
原格基与正交后的格基的span是同一张成空间.
正交后的格基无需是原格基所形成的格的等价基，甚至，它们一般不在一个格内，见Figure 4.

施密特正交化在维度空间有一个非常有用的用途：计算「容量」volumn。

在二维空间，容量就是面积，在三维空间，容量是体积，在更高维的空间，有更高级的概念。当格满秩时，格基所张成的「基础区域」的容量就可以直接对正交后的格基求行列式即可得到。

3. Successive minima

译为逐次最小长度，或者连续极小。【但是好像叫做最短向量长度更切合】

当我们刻画一个格时，一个基础属性是格的最短非零向量的长度。（格空间中总是存在一个零向量，它的范数norm为0）

范数：是一个定义在向量空间上的函数，它将向量映射到非负实数。直观地说，范数可以理解为“长度”的概念，类似于欧几里得空间中的距离。范数可以用来衡量向量的大小或“长度”，并且在许多数学和应用领域中都有重要的应用。一个向量的范数计作 $∣∣ a ∣∣$ .

Successive minima这个参数一般计作 $λ_{1}$ . 它主要刻画了格的稀疏程度。

它的另一种定义是：最短向量长度 r 是满足半径为 r 的「n维球」的一维张成空间（一条线）所包含的格点中所能形成的最短向量的长度。

于是我们可以推广到 the i-th successive minima 概念：

$λ_{i} (Λ) = in f {r ∣ d im (s p an (Λ \cap \overline{B} (0, r))) \geq i}$

其中 $\overline{B} (0, r)$ 表示以0格点为圆心，格点的范数小于等于 r 所构成的n维封闭球。r 就是满足这个球里的点形成的基向量最短的最短半径。

$λ_{i} (Λ)$ 表示格中第 i 短的线性无关向量。

下面开始解释：

n维球：这里强调n维，我们都知道球ball是一个三维概念，但是在不同维度空间，“球”坍塌或者扩张为其他表现形式，比如一维空间，球是一条线段，一条向量就在一个一维空间里。
下图中，假设两个格点的水平距离为1，那么 $λ_{1} (Λ) = 1$ , 但是 $λ_{2} (Λ) \neq = 2$ ，因为等于2的向量与 $λ_{1} (Λ)$ 对应的向量是线性相关的。

下面给出如何求 Successive minima 的有效下界：

定理 4：令 $B$ 是秩为 n 的格基，令 $\tilde{B}$ 是其施密特正交化的基，那么：

$λ_{1} (L (B)) \geq i = 1, .. n min ∣∣ \tilde{b}_{i} ∣∣ > 0$

推论 2：假设 $Λ$ 是一个lattice，存在 $ϵ > 0$ ，对于任意两个非等格点 $x, y \in Λ$ ，满足 $∣∣ x - y ∣∣ > ϵ$ .

【简单理解就是，在格中，两个不同的格点构成的向量的范数一定大于0，是非零向量】

断言 1：如果一个格 $Λ$ 最短向量长度存在，那么对于 $1 \leq i \leq n$ 格中一定存在某个 $v_{i} \in Λ$ 满足 $∣∣ v_{i} ∣∣ = λ_{i} (Λ)$

这里需要弄清楚一个事实：successive minima对应的最短向量不一定是格基。【如figure 4】

successive minima的上界

定理 4 给出了如何利用施密特正交化求得最短向量的下界，那么如何求它的上界呢？Minkowski给出了一个答案。

为了简单，我们考虑满秩格，非满秩格可以很简单的延伸。首先介绍一下 Blichfeld 定理：

定理 5 (Blichfeld)：任何满秩格 $Λ \in R^{n}$ 和集合 $S \subseteq R^{n}$ ( $v o l (S) > det Λ$ )，存在集合中两个不同的点，使得这两个点构成的向量属于格空间。

如图Figure 6，正如前面所说的，格的行列式表示的基础区域的容量。

定理 6(Minkowski’s Convex Body Theorem)：若 $Λ$ 是一个秩为 n 的格，那么对于任意一个中心对称的凸体 $S$ ，如果 $v o l (S) > 2^{n} det Λ$ ，那么 $S$ 中存在一个非零格点。

断言 2：半径为 r 的 n 维球的体积volumn为： $v o l (B (0, r)) \geq (\frac{2 r}{n})^{n}$ .

推论 3(Minkowski’s First Theorem) ：对于任意秩为 n 的满秩格 $Λ$ ，有：

$λ_{1} (Λ) \leq n (det Λ)^{1/ n}$

Minkowski’s First Theorem 给出的上界不一定很紧致tight。

还有 Minkowski’s Second Theorem：

$i = 1 \prod n λ_{i} (Λ)^{1/ n} \leq n (det Λ)^{1/ n}$

综上所述，施密特正交化给出了格的最短向量的下界，Minkowski’s First Theorem给出了满秩格的最短向量的上界。

4. Computational problems

经过上述介绍，我们可以看到，对于格的最短向量(非0)的只有一个大概的上下界，而我们目前没有有效算法找出最短向量。这就引出了我们在开头所述的底层数学难题，关于格的数学难题大概有两类：SVP和CVP。与密码学经典的数学难题一样（DLP，CDH，DDH…），关于格的数学难题也有很多变种，下面分别介绍一下。

Shortest Vector Problem(SVP)

SVP难题的变种也是根据难度划分为：是否真的需要找到最短向量？只需要找到最短向量的长度？或者甚至只要确定最短向量比某个给定的值小即可？具体是：

Search SVP：给定格基，找出最短向量。
Optimization SVP：给定格基，找出最短向量长度（Successive Minima）即可。
Decisional SVP：给定格基和一个有理数，判断格的最短向量长度是否比它小即可。

注意：以上难题中，均限制格基向量为整数向量，这要做的目的是为了输入可以用有限比特来表示，因此我们可以将SVP当做一个标准计算问题。我们也可以允许格基由有理向量组成。这将导致一个本质上等效的定义，因为通过缩放，可以使所有有理坐标为整数。

这三个变种，Search SVP、Optimization SVP和Decisional SVP的难度依次下降，但是反之亦然。因此，这三个难题是等价的。

在 Regev 课程中，考虑的是 SVP 的近似变体，近似因子 $γ \geq 1$ ：

Search $S V P_{γ}$ ：给定格基，找出近似最短向量。
Optimization $S V P_{γ}$ ：给定格基，找出最短向量长度的近似范围即可。
Promise $S V P_{γ}$ ：给定格基和一个有理数 r ，如果是 YES 实例，判断格的最短向量长度是否小于等于 r 即可；如果是 NO 实例，判断格的最短向量长度是否大于 $γ \cdot r$ 即可

最后一种也叫做 $G a pS V P_{γ}$ ，这种情况下每个实例都有特定的输入集合，如果输入不在这些集合中，将会导致未定义行为。

同样的，promise变体并不比optimization变体更困难，optimization变体不比Search变体更困难。反之，optimization变体不比promise变体更困难，但是Seach变体是否比optimization变体更困难尚且是一个开放问题。

Closest Vector Problem(CVP)

顾名思义，这个数学难题是为找到给定格点的最近格点。与 SVP 一样，对 CVP 也定义了三种变体：

Search $C V P_{γ}$ ：给定格基 $B \in Z^{m \times n}$ 和向量 $t \in Z^{m}$ ，找到另一个向量 $v \in L (B)$ 满足 $∣∣ v - t ∣∣ \leq γ \cdot d i s t (t, L (B))$ .
Optimization $C V P_{γ}$ ：给定格基 $B \in Z^{m \times n}$ 和向量 $t \in Z^{m}$ ，找到距离 d 满足 $d \leq d i s t (t, L (B)) \leq γ \cdot d$ .
Promise $C V P_{γ}$ ：给出一个CVP实例三元组 $(B, t, r)$ ，如果是 YSE 实例， $d i s t (t, L) \leq r$ ；如果是 NO 实例， $d i s t (t, L) > γ \cdot r$ .

以上两种都是计算难题。关于格还有一些易于计算的问题，比如：

成员关系：给定格基和向量，判定向量是否属于格。这个问题可以使用高斯消元法（Gaussian elimination）高效解决。
等价关系：给定两个格基，判定二者是否等价。这个问题可以按列判断包含关系，然后两者交换再检查包含关系。如果都成立，则说明二者等价。

Lattice基础

作者简介：Xor0v0，硕士在读，零知识证明小白，目前在做一些circom开发和zk审计，密码学爱好者，打过一些web2/3 CTF，最近对zkHACK产生兴趣。欢迎各位大佬一起交流学习。

Lattice是现代密码学非常重要的一部分，它也可以被用于构造零知识证明方案，比如这篇Lattice-Based zk-SNARKs from Square Span Programs。

总之，我会在这一系列中跟大家一起学习lattice的知识，分享我在Web3 CTF或者ZK Puzzle中遇到的可以使用到lattice的解法【第二篇LLL算法应该就有题分享】。

希望大家各有所获！！

强力推荐大家看原文，如果觉得英文不好理解，可以再看这里有没有答案。

1. 什么是格Lattice？

对于一个格，更正式的定义是：在m维实数空间，给定n个线性无关的m维向量 $b_{1}, b_{2}, \dots, b_{n} \in R^{m}$ ，由这些向量定义的格就是：

$L (b_{1}, b_{2}, \dots, b_{n}) = {\sum x_{i} b_{i} ∣ x_{i} \in Z}$

说明：如果没有特别说明，粗体字母表示向量。

线性无关向量：给定一组向量 $v_{1}, v_{2}, \dots, v_{n}$ ，如果存在一组不全为零的系数 $a_{1}, a_{2}, \dots, a_{n}$ ，使得下面的等式成立：

$> a_{1} v_{1} + a_{2} v_{2} + \dots + a_{n} v_{n} = 0 >$

则称这组向量是线性无关的。线性无关表示每一个元素都是相互独立，而没有冗余信息。

我们把这组线性无关向量称为格基(Basis of the lattice)。等价地，我们可以把这组向量按列展开，于是就得到它们的矩阵表示B，有：

$L (B) = L (b_{1}, b_{2}, \dots, b_{n}) = {\sum x_{i} b_{i} ∣ x_{i} \in Z}$

特别是： $L ((1))$ 是一个1维的满秩格。注意，一个维度空间的格基不唯一。

下面介绍两个概念：张成空间Span和基础区域fundamental parallelepiped。

张成空间： $L (B)$ 中基向量的所有线性组合(linear combinations)所形成的集合，就叫做这组基向量所张成的空间(SPAN),
基础区域：在不包含其他格点的前提下，格基所能张成的区域。【这个概念很重要！！】

$s p an (L (B)) = s p an (B) = {B y ∣ y \in R^{n}} P (B) = {B x ∣ x \in R^{n}, \forall i : 0 \leq x_{i} < 1}$

正如Figure 2(c)所示它就不是一个格基，那么第一个问题：给定n个m维向量，如何判断它是否是m维空间的一个格基呢？

定理1：格基所生成的基础平行四边形不应该包含除了初始格点（也就是 0 格点）以外的任何格点。

所有的Proof都省略，想了解的去看讲义。

第二个问题是：如何判断两个给定格基是否是等价的？

这里需要引入一个工具幺模矩阵Unimodular matrix：如果一个矩阵的行列式等于正负一，那么就称其为幺模矩阵。比如下面这个矩阵就是一个幺模矩阵：

$(1021)$

定理2：幺模矩阵的逆也是幺模矩阵。

定理3：两个格基 $B_{1}, B_{2} \in R^{m \times n}$ 是等价的，当且仅当存在某个幺模矩阵 $U \in Z^{n \times n}$ 使得 $B_{2} = B_{1} U$ 成立。

推论1：一个n维整数空间的格基 $B \in Z^{n \times n}$ 必然是一个幺模矩阵。

$d e t (B_{1}^{T} B_{1}) = d e t (U^{T} B_{2}^{T} B_{2} U) = d e t (B_{2}^{T}) B_{2}$

(这里大家可以复习一下多矩阵的行列式运算法则)

格的行列式大小与格子密度成反比，行列式越小，格子越多。

2. Gram-Schmidt Orthogonalization

在学习线性代数时，施密特正交化是一个非常基础且重要的处理工具。

它的作用是：把一组线性无关向量转化成一组正交的向量。这里推荐知乎上一篇图文并茂的文章。

二维平面的施密特正交化

一般形式的施密特正交化

对于n维欧氏空间，设一组基为 $b_{1}, b_{2}, \dots, b_{n}$ ，定义其施密特正交化之后的基向量为 $b_{1}, b_{2}, \dots, \tilde{b}_{n}$ 。其中:

$b_{i} = b_{i} - j = 1 \sum i - 1 \frac{( b _{j} , b _{i} )}{( b _{j} , b _{j} )} \tilde{b}_{j}$

上述 $(a, b)$ 记号表示两个向量之间的点乘。

sage中内置了施密特正交化的函数：对于矩阵 A，直接调用 A.gram_schmidt()

施密特正交化之后的基向量有如下特点：

基向量之间两两正交，即其点乘结果为0.
原格基与正交后的格基的span是同一张成空间.
正交后的格基无需是原格基所形成的格的等价基，甚至，它们一般不在一个格内，见Figure 4.

施密特正交化在维度空间有一个非常有用的用途：计算「容量」volumn。

3. Successive minima

译为逐次最小长度，或者连续极小。【但是好像叫做最短向量长度更切合】

当我们刻画一个格时，一个基础属性是格的最短非零向量的长度。（格空间中总是存在一个零向量，它的范数norm为0）

范数：是一个定义在向量空间上的函数，它将向量映射到非负实数。直观地说，范数可以理解为“长度”的概念，类似于欧几里得空间中的距离。范数可以用来衡量向量的大小或“长度”，并且在许多数学和应用领域中都有重要的应用。一个向量的范数计作 $∣∣ a ∣∣$ .

Successive minima这个参数一般计作 $λ_{1}$ . 它主要刻画了格的稀疏程度。

它的另一种定义是：最短向量长度 r 是满足半径为 r 的「n维球」的一维张成空间（一条线）所包含的格点中所能形成的最短向量的长度。

于是我们可以推广到 the i-th successive minima 概念：

$λ_{i} (Λ) = in f {r ∣ d im (s p an (Λ \cap \overline{B} (0, r))) \geq i}$

其中 $\overline{B} (0, r)$ 表示以0格点为圆心，格点的范数小于等于 r 所构成的n维封闭球。r 就是满足这个球里的点形成的基向量最短的最短半径。

$λ_{i} (Λ)$ 表示格中第 i 短的线性无关向量。

下面开始解释：

n维球：这里强调n维，我们都知道球ball是一个三维概念，但是在不同维度空间，“球”坍塌或者扩张为其他表现形式，比如一维空间，球是一条线段，一条向量就在一个一维空间里。
下图中，假设两个格点的水平距离为1，那么 $λ_{1} (Λ) = 1$ , 但是 $λ_{2} (Λ) \neq = 2$ ，因为等于2的向量与 $λ_{1} (Λ)$ 对应的向量是线性相关的。

下面给出如何求 Successive minima 的有效下界：

定理 4：令 $B$ 是秩为 n 的格基，令 $\tilde{B}$ 是其施密特正交化的基，那么：

$λ_{1} (L (B)) \geq i = 1, .. n min ∣∣ \tilde{b}_{i} ∣∣ > 0$

推论 2：假设 $Λ$ 是一个lattice，存在 $ϵ > 0$ ，对于任意两个非等格点 $x, y \in Λ$ ，满足 $∣∣ x - y ∣∣ > ϵ$ .

【简单理解就是，在格中，两个不同的格点构成的向量的范数一定大于0，是非零向量】

断言 1：如果一个格 $Λ$ 最短向量长度存在，那么对于 $1 \leq i \leq n$ 格中一定存在某个 $v_{i} \in Λ$ 满足 $∣∣ v_{i} ∣∣ = λ_{i} (Λ)$

这里需要弄清楚一个事实：successive minima对应的最短向量不一定是格基。【如figure 4】

successive minima的上界

定理 4 给出了如何利用施密特正交化求得最短向量的下界，那么如何求它的上界呢？Minkowski给出了一个答案。

为了简单，我们考虑满秩格，非满秩格可以很简单的延伸。首先介绍一下 Blichfeld 定理：

定理 5 (Blichfeld)：任何满秩格 $Λ \in R^{n}$ 和集合 $S \subseteq R^{n}$ ( $v o l (S) > det Λ$ )，存在集合中两个不同的点，使得这两个点构成的向量属于格空间。

如图Figure 6，正如前面所说的，格的行列式表示的基础区域的容量。

断言 2：半径为 r 的 n 维球的体积volumn为： $v o l (B (0, r)) \geq (\frac{2 r}{n})^{n}$ .

推论 3(Minkowski’s First Theorem) ：对于任意秩为 n 的满秩格 $Λ$ ，有：

$λ_{1} (Λ) \leq n (det Λ)^{1/ n}$

Minkowski’s First Theorem 给出的上界不一定很紧致tight。

还有 Minkowski’s Second Theorem：

$i = 1 \prod n λ_{i} (Λ)^{1/ n} \leq n (det Λ)^{1/ n}$

综上所述，施密特正交化给出了格的最短向量的下界，Minkowski’s First Theorem给出了满秩格的最短向量的上界。

4. Computational problems

Shortest Vector Problem(SVP)

Search SVP：给定格基，找出最短向量。
Optimization SVP：给定格基，找出最短向量长度（Successive Minima）即可。
Decisional SVP：给定格基和一个有理数，判断格的最短向量长度是否比它小即可。

这三个变种，Search SVP、Optimization SVP和Decisional SVP的难度依次下降，但是反之亦然。因此，这三个难题是等价的。

在 Regev 课程中，考虑的是 SVP 的近似变体，近似因子 $γ \geq 1$ ：

Search $S V P_{γ}$ ：给定格基，找出近似最短向量。
Optimization $S V P_{γ}$ ：给定格基，找出最短向量长度的近似范围即可。
Promise $S V P_{γ}$ ：给定格基和一个有理数 r ，如果是 YES 实例，判断格的最短向量长度是否小于等于 r 即可；如果是 NO 实例，判断格的最短向量长度是否大于 $γ \cdot r$ 即可

最后一种也叫做 $G a pS V P_{γ}$ ，这种情况下每个实例都有特定的输入集合，如果输入不在这些集合中，将会导致未定义行为。

Closest Vector Problem(CVP)

顾名思义，这个数学难题是为找到给定格点的最近格点。与 SVP 一样，对 CVP 也定义了三种变体：

Search $C V P_{γ}$ ：给定格基 $B \in Z^{m \times n}$ 和向量 $t \in Z^{m}$ ，找到另一个向量 $v \in L (B)$ 满足 $∣∣ v - t ∣∣ \leq γ \cdot d i s t (t, L (B))$ .
Optimization $C V P_{γ}$ ：给定格基 $B \in Z^{m \times n}$ 和向量 $t \in Z^{m}$ ，找到距离 d 满足 $d \leq d i s t (t, L (B)) \leq γ \cdot d$ .
Promise $C V P_{γ}$ ：给出一个CVP实例三元组 $(B, t, r)$ ，如果是 YSE 实例， $d i s t (t, L) \leq r$ ；如果是 NO 实例， $d i s t (t, L) > γ \cdot r$ .

以上两种都是计算难题。关于格还有一些易于计算的问题，比如：

成员关系：给定格基和向量，判定向量是否属于格。这个问题可以使用高斯消元法（Gaussian elimination）高效解决。
等价关系：给定两个格基，判定二者是否等价。这个问题可以按列判断包含关系，然后两者交换再检查包含关系。如果都成立，则说明二者等价。

LLL算法

作者简介：Xor0v0，硕士在读，零知识证明小白，目前在做一些circom开发和zk审计，密码学爱好者，打过一些web2/3 CTF，最近对zkHACK产生兴趣。欢迎各位大佬一起交流学习。

LLL 算法于 1982 年由三位 L 开头的外国人设计（因此得名），是一种解决 SVP 的近似算法。

LLL 算法的近似率为 $(\frac{2}{3})^{n}$ ，其中 n 是格的维度。在大多数应用中，n 都是一个常数，因此近似率是确定的。

1801年 Guass 给出一种解决二维 SVP 的算法， LLL 算法可以看作是Gauss的算法对高维的推广。

LLL 的用途：

分解整数或者有理数上的多项式。比如分解 $x^{2} - 1$ 为 $(x + 1)$ 和 $(x - 1)$ 。
求一个给定代数的最小多项式足够好的 approximation。例如，给定 $1.414213$ 输出 $x^{2} - 2 = 0$ ，给定 $0.645751$ 输出 $x^{2} + 4 x - 3 = 0$ 。
求解整数关系，对于一组实数 $x_{1}, \dots, x_{n}$ ，如果存在一组非全零整数 $a_{1}, \dots, a_{n}$ 使得 $a_{1} x_{1} + \dots + a_{n} x_{n} = 0$ 成立，则称为这组实数具有整数关系。比如，给定 $arctan (1), arctan (1/5), arctan (1/239)$ ，可以证明下列整数关系存在：

$arctan (1) - 4 arctan (1/5) + arctan (1/239) = 0$

这个等式被称为 $M a c hin$ 公式。

整数规划问题。这是一个著名的 NP 问题，使用LLL，可以在多项式时间解决固定数量变量的整数规划。
最近向量问题(CVP)，以及其他格问题。
密码分析中的各种应用（即破坏密码协议）。例如，对基于背包的密码系统的许多攻击。对RSA的一些特殊情况也有一些攻击，如低公共指数攻击(low public exponent attack)。此外，对DSA系统中求解 HNP 问题也是很好的攻击应用。

通俗意义上讲，LLL 算法就是把一个糟糕的格基转换为一个相当好的格基。所谓“糟糕”或者“好”，评价标准是这个格基是否短且与其他基向量接近于正交，如果是则是好的格基，否则是糟糕的格基。

下面从三个方面介绍 LLL 算法：

定义一个 LLL 规约基 (reduced basis)，
提出一种算法来寻找这样的规约基，
分析其运行时间。

1. Reduced Basis

首先回顾施密特正交化的定义：

定义 1: 给定 n 个线性无关向量 $b_{1}, b_{2}, \dots, b_{n} \in R^{n}$ ，其施密特正交化的定义为：

$b_{i} = b_{i} - j = 1 \sum i - 1 μ_{i . j} b_{j}, w h ere μ_{i, j} = \frac{( b _{i} , b ~ _{j} )}{( b _{j} , b _{j} )}$

定义 2: 如果下列情况成立，则格基 $B = b_{1}, b_{2}, \dots, b_{n} \in R^{n}$ 是一个 $γ - LLL$ 规约基:

$\forall1 \leq i \leq n, j < i, ∣ μ_{i, j} ∣ \leq 1/2$ .
$\forall1 \leq i < n, γ ∣∣ b_{i} ∣ ∣^{2} \leq ∣∣ μ_{i + 1, i} b_{i} + \tilde{b}_{i + 1} ∣ ∣^{2}$ .

Remark 1：把一个基转换为规约基总是有可能的，实际上 LLL 算法就是在做这件事。

Remark 2 ：考虑 $γ = 3/4$ 的情形是很有用的，在 LLL 算法中， $1/4 < γ < 1$ .

Remark 3 ：定义 2中的第二个条件可以等价变化为：

$γ ∣∣ b_{i} ∣ ∣^{2} \leq ∣∣ μ_{i + 1, i} b_{i} + b_{i + 1} ∣ ∣^{2} = μ_{i + 1, i}^{2} ∣∣ b_{i} ∣ ∣^{2} + ∣∣ \tilde{b}_{i + 1} ∣ ∣^{2}$

稍微变换之后，可知：第二个 property 可以解释为: $b_{i + 1}$ 不会比 $b_{i}$ 短很多。

具体的，我们考虑经过施密特正交化得到的格基矩阵为：

$∣∣ b_{1} ∣∣ 0 \dots 0 * ∣∣ b_{2} ∣∣ \dots \dots \dots \dots \dots 0 * * \dots ∣∣ \tilde{b}_{n} ∣∣$

【在线性代数中，正交基可以表示为基向量范数的上三角形式，这是由正交基的性质和格拉姆-施密特正交化过程的结果所决定的。】

其中列 i 显示了在这个正交基中 $b_{i}$ 的坐标。定义LLL规约基中的第一个条件保证：任何非对角元素的绝对值，最多是同一行对角线元素值的一半。这可以写成：

$∣∣ b_{1} ∣∣ 0 \dots 0 \leq \frac{1}{2} ∣∣ b_{1} ∣∣ ∣∣ b_{2} ∣∣ \dots \dots \dots \dots \dots 0 \leq \frac{1}{2} ∣∣ b_{1} ∣∣ \leq \frac{1}{2} ∣∣ b_{2} ∣∣ \dots ∣∣ b_{n} ∣∣$

第二个条件要求这个矩阵的第二列几乎和它的第一列一样长。

LLL 规约基的一个重要特性是它的第一个向量相对较短，如下一个 claim 所示。

Claim 1：假设 $b_{1}, b_{2}, \dots, b_{n} \in R^{n}$ 是一个 $γ - LLL$ 规约基，则有：

$∣∣ b_{1} ∣∣ \leq (\frac{2}{4 γ - 1})^{n - 1} λ_{1} (L)$

Remark 4: 如果 $γ = 3/4$ 则有：

$∣∣ b_{1} ∣∣ \leq 2^{\frac{n - 1}{2}} λ_{1} (L)$

2. LLL Algorithm

这里首先给出 LLL 算法的 python 伪代码：

def lll(basis):
  	while k <= n:
      	# reduction step loop
    		for j in reverse(range(k-1, 0)):
      	m = mu(k, j)
      	basis[k] = basis[k] - mu*basis[j] # vector reduction
    if lovasz_condition:
        k += 1
    else:
        basis[k], basis[k+1] = basis[k+1], basis[k] # swap step
        # update orthogonalized basis
        k = max(k-1,1)
    return basis

上面的介绍让 LLL 算法较为晦涩，下面从几个简单的角度解读 LLL 算法。

LLL vs GCD

LLL 算法与最大公约数 GCD 算法可以说是毫不相关，但是从思想上，二者有异曲同工之妙：皆为先 Reduction，后 Swap.

观察一下 GCD 算法的 python 伪代码:

def euclid_gcd(a, b):
  	if a < b:
      	a, b = b, a
    # base condition
  	if b == 0:
      	return a
    # reduction
    x = a mod b 
    return euclid_gcd(b, x) # swap

GCD 算法先是一个 reduction step 把数字变小，然后 swap step 交换数字顺序。返回条件是 b = 0。

再观察 LLL 算法的伪代码，也是先 reduction step，使用施密特正交化把基向量变小，然后 swap step 交换向量顺序。返回条件是所有的向量满足 lovacz_condition（暂且不管什么是lovacz_condition）。

LLL vs Gram-Schmidt

LLL 算法和施密特正交化算法（简称GS 算法）都是对格基进行处理的算法。GS 算法把格基处理为所有的基向量两两正交，其张成空间 span 与原格基相同，但是格（点）不一定相同。如第一讲所述，GS 算法是通过将基向量分为相关分量，然后从所有向量中减去冗余分量，从而达到正交化的目的。

在上一讲中，我们知道施密特正交基是 successive minima 的下界，那么是否可以直接使用 GS 算法来求得 LLL 规约基呢？答案是否定的。原因在于：GS算法可能可以让我们得到与 LLL 规约基相近的一组格基，但是不能保证它就是 LLL 规约基，这是由于 GS 正交基可能与原格基不属于同一个格。

sage: from mage import matrix_utils # https://github.com/kelbyludwig/mage; use the install.sh script to install
sage: b1 = vector(ZZ, [3,5])
sage: b2 = vector(ZZ, [8,3])
sage: B  = Matrix(ZZ, [b1,b2])
sage: Br,_ = B.gram_schmidt()
sage: pplot = matrix_utils.plot_2d_lattice(B[0], B[1])
sage: pplot += plot(Br[0], color='grey', linestyle='-.', legend_label='unmodified', legend_color='blue')
sage: pplot += plot(Br[1], color='grey', linestyle='-.', legend_label='orthogonalized', legend_color='grey')
sage: pplot

在 sage 中运行得到的图像:

注意灰色的格基已经不在和原格基属于同一格了。但是 GS 算法对于理解 LLL 算法仍然很重要，因为它会作为 LLL 算法的一部分。

LLL vs Gaussian Lattice Reduction

正如之前所介绍， Gauss 曾提出过一个解决二维格的最短向量问题 SVP 的算法，即 Gaussian Lattice Reduction，它启发了 LLL 算法的出现。给出 Gaussian Lattice Reduction 的 python 代码：

def gauss_reduction(v1, v2) {
  	while True:
  			if v2.norm() < v1.norm():
            v1, v2 = v2, v1 # swap step
        m = round( (v1 * v2) / (v1 * v1) )
        if m == 0:
            return (v1, v2)
        v2 = v2 - m*v1 # reduction step
}

暂时忽略掉 while 无限循环，注意到首先进行了一个 swap step，保证 $∣ v_{2} ∣ \geq ∣ v_{1} ∣$ 。【理由】

$m$ 表示 $v_{2}$ 在 $v_{1}$ 上的投影标量，这和 GS 算法产生的投影标量是相同的，但是运用了一个 round 函数将其四舍五入到最近的整数，这样做为了保证得到的向量仍然在同一个格中。注意，得到的新基向量的长度无疑会比原向量短。

直到两个向量之间的投影非常接近，停止循环，此时两个基向量会近似“正交”，而且长度较短。

LLL

下面正式介绍 LLL 算法的细节。与 Gaussian Reduction 类似，它也是根据输入的基向量进行迭代，然后对每个基向量进行长度规约。与 Gauss 规约不同的是，LLL处理的是 n 维基向量，因此需要一个方法确保输入的基向量的顺序不会影响到最终结果，这就是所谓的 lovasc condition，这个条件用于确定输入基向量是否需要执行 swap。

为了深入理解 LLL 算法，我们研究一下维基百科的 LLL python 代码实现：

def LLL(B, delta):
    Q = gram_schmidt(B)

    def mu(i,j):
        v = B[i]
        u = Q[j]
        return (v*u) / (u*u)

    n, k = B.nrows(), 1
    while k < n:

        # length reduction step
        for j in reversed(range(k)):
            if abs(mu(k,j)) > .5:
                B[k] = B[k] - round(mu(k,j))*B[j]
                Q = gram_schmidt(B)

        # swap step
        if Q[k]*Q[k] >= (delta - mu(k,k-1)**2)*(Q[k-1]*Q[k-1]):
            k = k + 1
        else:
            B[k], B[k-1] = B[k-1], B[k]
            Q = gram_schmidt(B)
            k = max(k-1, 1)

   return B

mu

首先是 mu 函数，可以看到函数代码就是求向量 $v$ 在 $u$ 上的投影向量，并且并没有四舍五入处理，即与 GS 算法中的投影向量一样，因此这个投影向量不一定在格中。所以这个函数就是求原格基 B 的第 i 个基向量在正交之后的格基 Q 的第 j 个基向量的投影标量。

我们已经知道 GS 正交化虽然能够提供一个理想的正交矩阵，但是它改变了格基所确定的格。因此我们考虑使用 mu 函数和 GS 正交化来辅助进行格基规约。

Length Reduction

接着，定义 n 为原格基的维度【满秩格】，k 表示当前函数处理的向量。两次循环中，内层循环负责针对 B[k] 对其之前所有的向量进行长度缩减：首先判断 $m u (k, j)$ 是否大于 $1/2$ ，如果大于 $1/2$ 则四舍五入并进行向量缩减，并然后更新施密特正交化，否则不做任何操作；外层循环则控制循环次数。

其实这里的长度缩减和 GS 正交化非常相似：

LLL Length Reduction

B[0] = B[0]
B[1] = B[1] - round(mu(1, 0))*B[0]
B[2] = B[2] - round(mu(2, 1))*B[1] - round(mu(2, 0))*B[0]
...
B[k] = B[k] - round(mu(k, k-1))*B[k-1] - round(mu(k, k-2))*B[k-2] - ... - round(mu(k, 0))*B[0]

GS 正交化

Q[0] = B[0]
Q[1] = B[1] - mu(1, 0)*Q[0]
Q[2] = B[2] - mu(2, 1)*Q[1] - mu(2, 0)*Q[0]
...
Q[k] = B[k] - mu(k, k-1)*Q[k-1] - mu(k, k-2)*Q[k-2] - ... - mu(k, 0)*Q[0]

lovesz condition and swap step

再关注到代码中的交换部分：

    # swap step
    if Q[k]*Q[k] >= (delta - mu(k,k-1)**2)*(Q[k-1]*Q[k-1]):
        k = k + 1
    else:
        B[k], B[k-1] = B[k-1], B[k]
        Q = gram_schmidt(B)
        k = max(k-1, 1)

对当前向量走完一轮长度缩减后，Lovász 条件将告诉我们是继续处理下一个基向量（代码第三行），还是将当前向量和前一个向量互换位置。

暂时忽略 Lovasz 条件的具体含义，这样的交换不免让我们想起了某些排序算法。 $k$ 是当前处理的基向量的索引，假设对于第 $k$ 个基向量的 Lovasz 条件为真，则 LLL 开始处理第 $k + 1$ 个基向量，此时大致上可以说从第 0 个基向量到第 $k$ 个基向量是按长度排序的。如果 Lovasz 条件为假，则将该向量放在 $k - 1$ 的位置，然后重新处理第 $k - 1$ 个基向量。在完成又一轮长度缩减后，再次回到交换步骤，决定是否需要再次交换该基向量的位置。于是我们也可以这样描述 LLL 算法：LLL 算法是一种向量排序算法，不过在向量长度缩减过程中向量变小可能会扰乱顺序，因此必须重新排序。于是我们也可以这样描述 LLL 算法：LLL 算法是一种向量排序算法，不过在向量长度缩减过程中向量变小可能会扰乱顺序，因此必须重新排序。

而对于 Lovasz 条件本身，它是一种启发式，用于确定向量是否处于“良好”的顺序。启发式就是那种没法去证明的但是又能用的，就好比机器学习中的调参，调太差了不准，太好了又会过拟合，于是不断微调去找到一个大差不差的。Lovasz 的描述有多种，感兴趣的读者可以参看一下这篇 StackOverflow 上的这篇文章。

根据 lovasz 条件，可以推出 LLL 算法输出的最短基向量 $v_{1}$ 满足：

||\pmb{v_1}||\le 2^{(n-1)/4}|\det(L)|^{1/n}\and ||\pmb{v_1}||\le 2^{(n-1)/2}\min_{0\neq v\in L}||\pmb{v}||

而根据 minkowski 凸体定理有： $λ_{1} (L) \leq n r = ∣ det (L) ∣^{1/ n}$

因此，在使用 LLL 算法时可以通过上述公式判断目标向量是否满足上述条件。

3. Complexity Analyze

分析包括两个步骤。首先，我们 bound 了迭代次数。其次，我们 bound 了单个迭代的运行时间。

可以证明：算法的总体运行时间是关于输入规模的多项式。输入规模的 rough下界由 $M = max {n, lo g (ma x_{i} ∣∣∣ b_{i} ∣}$ 给出。（因为 n 个向量中的每一个都需要至少一位来表示，范数为 r 的向量需要至少 $lo g r$ 位来表示)。

定理 1: 迭代次数是关于 M 的多项式。

定义 5: 给定格基 B，那么 B 的 potential 是它的施密特正交化后的基的范数乘积。

整个证明过程没看懂，下次如果看懂了再来补充。有兴趣的可以去看原文，证明过程使用到了这个格基的 Potencial。

Nearest Plane Algorithm for CVP

作者简介：Xor0v0，硕士在读，零知识证明小白，目前在做一些circom开发和zk审计，密码学爱好者，打过一些web2/3 CTF，最近对zkHACK产生兴趣。欢迎各位大佬一起交流学习。

首先回顾一下 CVP 问题：给定格和一个点，求与之最近的格点。它有三种近似（approximation）变体，分别是 Search $C V P_{γ}$ ， Optimization $C V P_{γ}$ 和 Promise $C V P_{γ}$ ，其中 $γ \geq 1$ 是近似因子。如果近似因子等于 1，那么就得到这些问题的精确版本。

1986年，Babai提出了名为 Nearest Plane Algorithm 的算法可以解决CVP问题的近似变体，它的近似率达到了 $2 (\frac{2}{3})^{n}$ ，其中 n 代表格的秩。当 n 确定时，我们也就得到了近似率，进而可以确定近似因子 $γ$ .

Babai’s nearest plane algorithm可以解决 Search $C V P_{γ}$ ，这意味着解决了它也就可以解决其他两种近似变体（因为其他两种近似变体不难于search 变体）。

1. Nearest Plane Algorithm

整个算法分为 2 步，第一步通过 LLL 算法对输入的格基进行规约，然后寻找关于这个格基的一个整数线性组合使其接近于目标向量 $t$ 。第二步基本上与 LLL 算法中 reduction 步骤的内层循环是相同的。

/*
		basis: lattice basis, a (m * n) matrix
  	t: target vector, (1 * m)
/*
def cvp(basis, t):
  	def mu(b,j):
        u = Q[j]
        return (b*u) / (u*u)
    
  	basis = lll(basis)
    b = t
    for j in reversed(range(n)):
        b -= round(mu(b, j)) * basis[j]
    return t - b

不难看出，cvp 算法的时间复杂度也是关于输入规模的多项式时间。注意，cvp 算法不要求格是满秩的。

考虑一个正交基向量集合 $b_{1} /∣∣ b_{1} ∣∣, b_{2} /∣∣ b_{2} ∣∣, \dots, b_{n} /∣∣ b_{n} ∣∣$ ，如果是满秩格（ $m = n$ ），这就是归一化的正交基，而如果不是满秩格，则需要扩展 $m - n$ 个基向量。

简单阐述 CVP 算法的思想就是：找到这些 LLL 规约基向量（列向量）的一个整数组合，使得它们构造出向量的每个坐标 $i$ 的值都在目标向量 $t$ 对应坐标值的 $\pm \frac{1}{2} ∣∣ b_{i} ∣∣$ 范围内。因此，算法首先需要找到第 $n - 1$ 个基向量的倍数，使得目标向量第 $n - 1$ 个坐标值在 $\pm \frac{1}{2} ∣∣ b_{n} ∣∣$ 范围内。然后是第 $n - 2$ 个基向量，直至第 $0$ 个基向量。注意，如果格不是满秩的，则最后 $m - n$ 维对应于与格 span 正交的空间。

上述描述也许比较晦涩，下面给出一个关于算法中递归操作的最自然的解释，并且更加呼应算法的名字：

假设 $s$ 是 $t$ 在张成空间 $s p an (b_{1}, b_{2}, \dots, b_{n})$ 的一个投影；
找到倍数 $c$ ，使得 $c \tilde{b}_{n} + s p an (b_{1}, \dots, b_{n - 1})$ 尽可能的接近于 $s$ ；
令 $s^{'} = s - c b_{n}$ ，递归调用 $s^{'}$ 和 $s p an (b_{1}, \dots, b_{n - 1})$ ，令其答案为 $x^{'}$
返回 $x = x^{'} + c b_{n}$ 即是最接近 t 的向量。

首先第一步是把目标向量 t 投影到向量空间中，最接近 $t$ 的格向量与最接近 $s$ 的格向量相同，因此这一步是有意义的。在第二步中，我们确定了格的平移，并且推测目标向量就在这里。在第三步递归中，我们不断的“降维”找到最接近目标向量的向量。最终我们把它平移回 $c b_{n}$ ，我们认定这就是最近向量。

关于算法的正确性参考讲义内容

2. HNP: An application of CVP

HNP(Hidden Number Problem)，这个问题由Dan Boneh于1996年提出，它论述了计算Diffie-Hellman共享密钥的最低有效位与计算完整密钥同样难。另一位大佬，使用Lattice攻破了DSA的HNP问题，参考论文。

正如密码学其他的困难问题一样，HNP也被定义为与“Oracle”之间的游戏，游戏中Oracle可以大致输出用户给定的输入的最低有效位。

具体而言，基于 n 比特质数和一个 k 比特最低有效位（Most Significant Bits）的 leak，我们定义Oracle的输出为： $MS B_{k} (x) = z$ ，满足 $∣ x - z ∣ < \frac{p}{2 ^{k + 1}}$ 在原始论文中，HNP可以表述为：对于随机的 $g^{x}$ ，给定 $g^{x}$ 和 $MS B_{k} (α g^{x} mod p)$ ，问是否可以求出隐藏的数字 $α$ ？其中 $g^{x}$ 是随机的，论文中还提出了几种变体，但本文只关注随机版本的HNP。

下面先给出求最低有效位的实现：

# Some parameters of the game, chosen for simplicity.

# p - A prime number for our field.
p = next_prime(2^16)

# n - The number of bits in `p`.
n = ceil(log(p, 2))

# k - The number of significant bits revealed by the oracle.
# Using parameters from Thereom 1.
k = ceil(sqrt(n)) + ceil(log(n, 2))

def msb(query):
    """Returns the MSB of query based on the global paramters p, k.
    """
    while True:
        z = randint(1, p-1)
        answer = abs(query - z)
        if answer < p / 2^(k+1):
            break
    return z

def create_oracle(alpha):
    """Returns a randomized MSB oracle using the specified alpha value.
    """
    alpha = alpha
    def oracle():
        random_t = randint(1, p-1)
        return random_t, msb((alpha * random_t) % p)
    return oracle

所以最低有效位到底泄漏了什么？根据定义，我们发现， $MS B_{k} (x)$ 的输出是不唯一的，并且输出与 p 有关。顾名思义，最低有效位就是一个数字的最低若干比特，本应该是确定的，与其他数无关的。而这两种特性就是 HNP 问题定义中的“大致”所造成的。

因此如何去理解 $MS B_{k} (x)$ 函数？注意到：

当 $z = x$ ，Oracle 总会输出这个结果，且结果就为 x。
其他的结果将会在 $x$ 附近上下波动。
随着 $k$ 的增大，不等式右边的 $z$ 的选择会极度下降，合法的 $z$ 越来越少，也越来越接近 $x$ 。
Oracle 输出值不一定只泄漏 $x$ 的 $k$ 比特信息，随着 $k$ 增大， $z$ 的范围越小，则会泄漏 $x$ 更多比特信息。

也就是说，当 $k$ 越接近 $p$ 的位数，Oracle 输出越接近 $x$ 。

那么什么时候 HNP 将是可解决的呢？Dan Boneh的论文指出：当 k 接近 $lo g p$ 时，使用 $d = 2 n$ 次Oracle查询就可恢复出隐藏数字。于是，给定一个 Oracle，我们如何去求解 HNP 呢？答案是：当可以得到 Oracle d 次回复后，solution可以视为 CVP 的一个特例。这个 CVP 的特例在给定足够多 Oracle 回复和特别选定的一组格基的情况下将会很容易解决。

这组格基是：

[  p,  0, ... ,  0,   0 ]
[  0,  p, ... ,  0,   0 ]
[         ...           ]
[  0,  0, ... ,  p,   0 ]
[ t1, t2, ... , td, 1/p ]

其中， $t_{n}$ 是 Oracle 的输入。Oracle 的输出 $[a 1, a 2, \dots, a d, 0]$ 就是我们需要求解的最近向量。

假设某个向量第一个系数为 $α t_{1} mod p$ ，由于 $α$ 是最后一行的整数标量， $mod p$ 记号相当于减去若干整数倍的第一行。假设向量 $v = [α t_{1}, α t_{2}, \dots, α t_{d}, α / p]$ ，求得到这个向量我们就能很轻易的恢复出 $α$ 。根据 $MS B_{k} (x)$ 的定义，发现 $v$ 是非常接近于 $z$ 的。于是我们可以通过 CVP 算法去找到这样的向量，进而恢复 $α$ 。

注意，其实模数 p 并非一定要固定，模数改变仍然是 HNP 问题。

Paradigm 2023 Oven

题目地址： https://github.com/paradigmxyz/paradigm-ctf-2023/tree/main/oven

#!/usr/bin/env python3
from Crypto.Util.number import *
import random
import os
import hashlib

FLAG = os.getenv("FLAG", "PCTF{flag}").encode("utf8")
FLAG = bytes_to_long(FLAG[5:-1])
assert FLAG.bit_length() < 384

BITS = 1024


def xor(a, b):
    return bytes([i ^ j for i, j in zip(a, b)])


# This doesn't really matter right???
def custom_hash(n):
    state = b"\x00" * 16
    for i in range(len(n) // 16):
        state = xor(state, n[i : i + 16])

    for _ in range(5):
        state = hashlib.md5(state).digest()
        state = hashlib.sha1(state).digest()
        state = hashlib.sha256(state).digest()
        state = hashlib.sha512(state).digest() + hashlib.sha256(state).digest()

    value = bytes_to_long(state)

    return value


def fiat_shamir():
    p = getPrime(BITS)
    g = 2
    y = pow(g, FLAG, p)

    v = random.randint(2, 2**512)

    t = pow(g, v, p)
    c = custom_hash(long_to_bytes(g) + long_to_bytes(y) + long_to_bytes(t))
    r = (v - c * FLAG) % (p - 1)

    assert t == (pow(g, r, p) * pow(y, c, p)) % p

    return (t, r), (p, g, y)


while True:
    resp = input("[1] Get a random signature\n[2] Exit\nChoice: ")
    if "1" in resp:
        print()
        (t, r), (p, g, y) = fiat_shamir()
        print(f"t = {t}\nr = {r}")
        print()
        print(f"p = {p}\ng = {g}\ny = {y}")
        print()
    elif "2" in resp:
        print("Bye!")
        exit()

题目大意就是用户可以获取 FLAG 随机签名，生成随机签名的逻辑就在 fiat-shamir 函数里。

我们可获得的信息有 t, r, p, g, y ，其实 c 也可以求出。那么就可以关注 fiat_shamir 函数中使用到 FLAG 进行签名的部分，即： r = (v - c * FLAG) % (p - 1) 。分析一下： r, c, p 均是已知值，且 FLAG 的位数已经确定： assert FLAG.bit_length() < 384 。可以使用上述 HNP 问题（模数可变），可使用标准的格算法进行攻击。解法如下：

首先对上述式子稍微变形： $r - v + c * F L A G = 0 mod (p - 1)$ ，只有 v 和 FLAG 是未知数。非常标准的随机版本HNP。
我们可以根据上述式子构建 Lattice： $M = (q_{1} - 1) c_{1} r_{1} (q_{2} - 1) c_{2} r_{2} (q_{3} - 1) c_{3} r_{3} 10 K$

解释：

K是FLAG的一个上界
空白处都为0

根据Babai的CVP解决算法，一定存在一个解向量 $j = (l_{1}, l_{2}, l_{3}, F L A G, 1)$ ，使得 $j M = j_{k}$ 成立
注意到 $j_{k}$ 在格中是一个短向量，于是我们可以采用 LLL 算法在多项式时间内找到这个短向量。注意，短向量的每一个元素用 64bit可以表示，于是上界 $K = 2^{64}$ 。

这里还需要解释一下数据量的问题，怎么知道需要多少数据可以恢复出 FLAG 呢？这个需要使用到 gaussian heuristic 估计最短向量长度，要求的目标向量范数小于这个长度即可。【但是由于这是ctf，所以一般就三四五组数据就出来了，这里我先收集了5组数据备用，实际上用了3组数据，就可解出FLAG】。

我们可以使用论文的方式构造格矩阵，然后使用 LLL 算法在多项式时间内找到一个解向量，FLAG值就在这个向量里。

下面贴出EXP（需要使用 sage-python）。

from Crypto.Util.number import *

BITS = 1024
def xor(a, b):
    return bytes([i ^^ j for i, j in zip(a, b)])

def custom_hash(n):
    state = b"\x00" * 16
    for i in range(len(n) // 16):
        state = xor(state, n[i : i + 16])

    for _ in range(5):
        state = hashlib.md5(state).digest()
        state = hashlib.sha1(state).digest()
        state = hashlib.sha256(state).digest()
        state = hashlib.sha512(state).digest() + hashlib.sha256(state).digest()

    value = bytes_to_long(state)

    return value


g = 2
# p = remote("oven.challenges.paradigm.xyz", 1337)
# # v = (c * flag - r) % (p-1)
# t = 5
# while t > 0:
#     p.sendafter(b'Choice: ', b'1')
#     a = p.recvuntil(b't =')
#     t = int(p.recvuntil(b'\n', drop=True).decode())
#     a = p.recvuntil(b'r = ')
#     r = int(p.recvuntil(b'\n', drop=True))
#     a = p.recvuntil(b'p = ')
#     p = int(p.recvuntil(b'\n', drop=True))
#     a = p.recvuntil(b'g = ')
#     g = int(p.recvuntil(b'\n', drop=True))
#     a = p.recvuntil(b'y = ')
#     y = int(p.recvuntil(b'\n', drop=True))
#     C = [0]
#     R = [0]
#     C.append(custom_hash(long_to_bytes(g) + long_to_bytes(y) + long_to_bytes(t)))
#     R.append(r)
#     t -= 1
t, r, p, y = [0] * 5 , [0] * 5, [0] * 5, [0] * 5
t[0] = 77203516334611379622052884088061339907818193440975523438325956774518601252973654146535129884349539724229562993644509567711307331031087898034347437358013492439542334272757402388064753335866738748958633246857368058563448192261648964749496750146315450540579452655462143813022469489449782882109182150142188348915
r[0] = 116220687218790216091346463439819557695309512176282372943331613053767874084111192169275378671194392846117055362014832383093646731110903547936340541580638231783076185430700045752799252596702505486227877656990705143138976716233681199944248043915239678537679463030334043412573684866623347545004904612417007327217
p[0] = 120199526136097511651530856988060166616679725925744594620901500430819054365226668422844742178771316732438545888088210068701212930988908604238682153307940417480817112540019257024703372145496636861112290091005527647339212358159274475077103689996624113678044891963676612334769162753166782062809526104431258739517
y[0] = 113120257926989954605307518460817169666869094087243249194566086300779837721481071230484420555504633839932263287201776945834030877253212748181186108770595676114564711457140738635967367144272960236148346810327070118837330648022676963528356209004524421455348155068637534190736042536625876773755044593606026293621

t[1] = 41870694301936832255997763505666386906032641226067235004722895066736677752643938706563985367861597477876358530714740119529535551345537670465925209944735777464498665457291484991606280197421907773811941255514802343059520166452091324746732103649911088736843268706303230993742963740287185306251052313964374872878
r[1] = 12006544761341621619143613218949584457040818188588282396732221317912350712975184254483346994199077889478797005980544401923303196850089656891130607887735812677733676744158835380723268515678724429529904080449565289532493612340517128773817940478185157405384294596975266141639161297056291778600404606940053392754
p[1] = 144976418899543143198454834264506179459614866666312385853989423989111679486891620786778481577472101748200328617607483446519049911023390427543308348494008425688855119367843479385647790189753163858970088620586505610840306212549243890107847423807556106192434514110736278569625282073529181653986405771513594134987
y[1] = 115167386542298909971939136044531943159982371048242494889745996527683250097061534781946312891817534916886291355204474301571862159042350976750824212346443402817552375266223638549309886922860921533308382456941718605370216473858986207878047206914813902333192745354148659984602740644345120423788258359941122554440

t[2] = 87583398382601313926735945950364130572816213989909728661491063393166341618362097121819023078210854251839415225428442334046015192711593400640556960974162962105001700930842075200923675422451049033428478754684678493480503204152097382431043129863362081278994409790477935899740897031656629902670114002180266872266
r[2] = 102934065416140965550261549535302192284582871606378190882003659362832329206469482926448881926648454509204767788745574969527319053553977362277660636749471357711849435384231867496681956889560719871615670691536165668156919285052370364456208767031233707532145718791283351837119192545712583721765194876277656314501
p[2] = 148550372281025138704553107737801144273208690400094973764375300381759456124146034135721454543469874579375457504983315183916592877731262163382903701414433532933994780412246010260680217160047355295328211970740422311833479381733781665221952277321615395653804905426059251551309558237245071919868160643681548296643
y[2] = 140198181685722792932050421128846820269664976993249152496309458637445728558822919357043381776927596511506695168631000635135982453895569864162220417018046902591680662347467431250148020323787868422484882819040766008876291088199475630773774170507517261352416744218315033367149608507518388781373699289693595499544

t[3] = 84522638373733120165414722745998118253921972157096808350845007682435315263298662575419222718886673005893479175168776223733676055437884841441137160382376309254755315837431162807596684224207280410300146602535834124511928134257346386899792746556440632650091111389088724071203568000188430042064500145669267026805
r[3] = 18194520459417696159241442307764982202112775710358263541565999857475375951014745782344717997571109484480490257320469370655821185611675102820226656623202547826938945675557174044055104570245311622199906030109190773202049867448625926033119474090713737736579814394048548084259404911639299693897437586858871472420
p[3] = 103592121279236435866010649601463899558315038309765463516665073413464806869884601040096405354399740035138081866812671953467986059509640644754973422603659825874707510675199511411437487386173194105311776020901134014680450244319046258962912483163270496586124101308664731409973532774829535980996775736651508448187
y[3] = 14795900031448786771559087453548388682769488350377145090464794455644462363656204398769939585810191748312766604278524960492756615478207654208905403516432929452543777164921589629460212814049479518397521600744701463005793924336243982001830978693343863219168046923285752069874971698699611717027496799587761203398

t[4] = 137831113158715069584199906447354477289195801883097400523644937444161950367086728510388467524069532778534704803863447302183665431906725284462350375136938902398115607751357373983532375894744842377064414618294084293556345908653608825144019924463160996581138334794345538184522294219836499291245958693984828705682
r[4] = 3997479613798995088324714249284251759517244566415954213469045459939167234231804927756343425727094668124791771030709612850292188541459113635924389128360073088700133564458353848851347410209029075825332791761713207287049093830610503236793718093861017715600469118069736180200062407135030791797264421955154056362
p[4] = 138872772594377036406739890812487312629206229880091799534033353266413752242871671695030657233827552372256865312690361457743622953282647882392520626248323032818493170021525093526571072858177665184977821075559705014261503440906447428819858532553737164369106583570452357928945241596555378143414688075425304805029
y[4] = 26528279589882510502916765470759890048295757018825608100058824483278181810141819962488106009190787416456734047325734614749916264837565765983213768504298640943869226245566784325431289650031372028094050672872660334951958006567067601586551947694563576820491204290496425885685101313332190690230962899252834723225

i = 0
C = [0]
R = [0]
while i < 5:
    C.append(custom_hash(long_to_bytes(g) + long_to_bytes(y[i]) + long_to_bytes(t[i])))
    R.append(r[i])
    i += 1
    
C = C[1:]
R = R[1:]
# print(C)
# print(R)

M = matrix(ZZ, 5, 5)
for i in range(3):
    M[i, i] = p[i]
    M[3, i] = C[i]
    M[4, i] = R[i]
    M[i, 3] = M[i, 4] = 0
M[3, 3] =  1
M[4, 4] = 2^64
M[3, 4]= 0
    
v = M.LLL()[0]
print(v)
flag = v[3] % p[3]
print(long_to_bytes(flag))

Attack on RSA with Low Public Exponent

作者简介：Xor0v0，硕士在读，零知识证明小白，目前在做一些circom开发和zk审计，密码学爱好者，打过一些web2/3 CTF，最近对zkHACK产生兴趣。欢迎各位大佬一起交流学习。

RSA 公钥加密系统自1977年被提出至今，目前仍然在很多领域被广泛使用，许多研究人员致力于找到其安全漏洞来攻克它。

在此期间，很多高明的攻击方法被提出。但至少在目前（2024初），在保证选取足够安全的加密参数情况下，RSA的加密强度仍然是现代电脑无法攻破的。

本小节，我们介绍其中一种高明的攻击方法，它源于 Hastad ，后由 Coppersmith 改良，当 RSA 使用一个小公共指数 $r$ 时，攻击容易被实现。攻击思路基于找到低次多项式的一个小的根的算法，这个算法又需要使用 LLL 算法。这种寻找根的算法本身非常有意思，也用于其他攻击 RSA 系统的算法中。

1. RSA Review

让我们回顾一下 RSA 最简单的加密版本，同时也最能体现密码学和数学的高明之处的加密算法。该算法基于大数分解难题假设。

令 $N = pq$ ，其中 $p, q$ 是同等规模的大质数。令 $r, s$ 是满足 $rs \equiv 1 (mod φ (N))$ ，其中 $φ (N) = (p - 1) (q - 1)$ 是乘法群 $Z_{N}^{*}$ 的阶。

我们称 $N$ 为 RSA 模数， $r$ 为公共指数。 $(N, r)$ 对是公钥，用于加密信息。 $(N, s)$ 对是私钥，只有拥有私钥的人才能解密信息。给定要加密的信息为整数 $m \in Z_{N}^{*}$ ，为了对 $m$ 加密，需要计算 $c \equiv m^{r} (mod N)$ 。为了对 $c$ 解密，需要计算 $m \equiv c^{s} (mod N)$ 。算法的正确性可由欧拉定理证明。

2. Low Public Exponent RSA

在许多实际应用场景中，加密过程是在算力受限设备上进行的，因此将 $m$ 计算到高次是非常消耗电量、时间的。因此有人尝试简化加密过程，把公共指数 $r$ 设置为很小的数，比如 $r = 3$ 。如此一来，加密过程简化很多，只需要计算 $m^{3}$ ，使用两次乘法即可。

乍一看，在不知道 $N$ 的因数分解的情况下，好像没办法恢复出密文。然而，正如本文所要介绍的，存在一些高明的攻击手段。

首先我们回顾一下中国剩余定理（CRT）：给定 $b$ 个等式 $x \equiv a_{i} (mod p_{i})$ ，其中 $p_{i}$ 互素。则存在唯一的 $x (mod p_{1} \cdot p_{2} \dots p_{r})$ ，并且可以高效的找到这个 $x$ 。

回到低指数加密场景中，假设 A 现在要发送 B、C、D 同样的信息 $m$ ，用各自的公钥分别加密，为： $c_{B} \equiv m^{3} (mod N_{B}), c_{C} \equiv m^{3} (mod N_{C}), c_{D} \equiv m^{3} (mod N_{D})$ 。那么这种情况下，可以很容易恢复明文 $m$ 。

不失一般性，我们假设这三个模数都是互素的（如果不互素，则可以找到公因子，然后直接恢复明文），攻击者可以由中国剩余定理计算一个值 $x \equiv m^{3} (mod N_{B} \cdot N_{C} \cdot N_{D})$ 。由于 $m < N_{B}, N_{C}, N_{D}$ 成立，则 $m^{3} < N_{B} N_{C} N_{D}$ 成立。那么我们计算的 $x = m^{3}$ ，最后我们对 $x$ 开三次方即可。

上述攻击成功的前提是若干次加密都是使用同样的明文，那么如果给每个人发送的消息都不一样呢？考虑如下解决方案：每个人除了公私钥，还有一个唯一的 ID 号，现在 A 对 B、C、D 发送的加密消息变更为： $c_{B} \equiv (m + 2^{k} I D_{B})^{3} (mod N_{B}), c_{C} \equiv (m + 2^{k} I D_{C})^{3} (mod N_{C}), c_{D} \equiv (m + 2^{k} I D_{D})^{3} (mod N_{D})$ 。其中 $k$ 是消息 $m$ 的比特长度。这种方式下，攻击者就不能通过上述中国剩余定理进行攻击了。

3. Coppersmith’ Method

事实上，对于上述修改方案，我们可以采用一个更一般的攻击方法，这需要使用到 Coppersmith’ Method。

Coppersmith’ Method的作用：设存在一个模多项式 $F (x) \equiv x^{3} + x + 123 (mod M)$ 。如果该模多项式的根为 $x_{0}$ ，即 $F (x_{0}) \equiv 0 (mod M)$ ，且根足够小。那么就可以用 Coppersmith’ Method 去找这个小根。

首先，如果知道 $M$ 的因式分解，那么这个问题是容易解决的，只需要分别在素因子的子群下解模多项式，然后用一个中国剩余定理即可。另外，如果我们能够找到一个解满足 $x^{2} \equiv q (mod M)$ ，并且这个 $x$ 不等于 $\pm 1 (mod M)$ ，那么可以用欧几里得算法将模数分解。因此，我们不寄希望于有一个有效算法对于所有这样的同余式都能找到解，否则也就意味着大数分解难题可以破解了。

既然不能对所有的模多项式都能找到解，那么找到解的条件是什么呢？结论是：对于次数（degree）为 $d$ 的多项式 $F (x)$ ，如果 $x_{0}$ 满足 $F (x_{0}) \equiv 0 (mod M)$ 且 $∣ x_{0} ∣ < \frac{1}{2} M^{\frac{1}{d} - ϵ}$ ，那么这个解可以在多项式时间内找到。

First step

不失一般性，设 $d$ 模 $M$ 多项式为首一多项式： $F (x) \equiv x^{d} + a_{d - 1} x^{d - 1} + \dots + a_{0} (mod M)$ （得到首一多项式很简单，只需要对多项式乘以 $a_{d}^{- 1} (mod M)$ 。而如果 $a_{d}^{- 1} (mod M)$ 不存在，则我们找到了 $M$ 的一个因子，这个同余式可以拆成同余式组，使用中国剩余定理即可）。假设存在一个整数 $x_{0}$ 满足 $F (x_{0}) \equiv 0 (mod M)$ 且 $∣ x_{0} ∣ < M^{\frac{1}{d}}$ ，我们的任务就是找到这个 $x_{0}$ 。

我们想：如果存在另一个多项式 $G (x)$ 的根也是 $x_{0}$ ，且它的系数很小，那我们就可以通过求根公式或者牛顿迭代法将 $x_{0}$ 求出。而Coppersmith’ Method 算法核心思路就是把 $F (x)$ 通过一系列变换规约成 $G (x)$ 。【注意 $G (x)$ 不是模多项式】

Example 1

设 $M = 17 * 19 = 323, F (x) = x^{3} + 33 x + 215$ ，我们想找到一个小根满足 $F (x) \equiv 0 (mod M)$ 。【这里 $x_{0} = 3$ ，但在整数域下 $F (3) \neq = 0$ 】

我们可以找到 $G (x) = 9 F (x) - M \cdot (x + 6) = 9 x^{2} - 26 x - 3$ 满足 $G (3) = 0$ ，这个解可以用求根公式得到。

ok，这就是 Coppersmith’ Method 的核心思想。

接下来是讨论 $x_{0}$ 的界的问题（多小的根算小根？）以及提高界的手法。

我们定义 $X$ 为这个 $∣ x_{0} ∣$ 的上界，然后我们把 $F (X)$ 用向量的形式表示： $b_{F} = (a_{0}, a_{1} X, \dots, a_{d} X^{d})$

Howgrave-Gramham 定理

给定模多项式 $F (x)$ ，模数为 $M$ ，根的上界为 $X$ ， $F (X)$ 的向量表示为 $b_{F}$ ，满足 $F (x_{0}) \equiv 0 (mod M)$ 。那么，当 $∣∣ b_{F} ∣∣ < \frac{M}{d + 1}$ 时，有 $F (x_{0}) = 0$ 。

Proof:

根据柯西不等式有： $(\sum_{i = 1}^{n} x_{i} y_{i})^{2} \leq (\sum_{i = 1}^{n} x_{i}^{2}) (\sum_{i = 1}^{n} y_{i}^{2})$ ，当 $y_{i} = 1, x_{i} \geq 0, 1 \leq i \leq n$ 时，柯西不等式变形为： $\sum_{i = 1}^{n} x_{i} \leq n \sum_{i = 1}^{n} x_{i}^{2} = n ∣∣ (x_{1}, \dots, x_{n}) ∣∣$ 。

我们首先把 $F (x_{0})$ 表示为 $\sum_{i = 0}^{d} a_{i} x_{0}^{i}$ ，可得到不等式： $∣ F (x_{0}) ∣ = ∣ \sum_{i = 0}^{d} a_{i} x_{0}^{i} ∣ \leq \sum_{i = 0}^{d} ∣ a_{i} ∣∣ x_{0} ∣^{i}$ 。

把 $x_{0}$ 的上界代入有： $∣ F (x_{0}) ∣ \leq \sum_{i = 0}^{d} ∣ a_{i} ∣∣ x_{0} ∣^{i} \leq \sum_{i = 0}^{d} ∣ a_{i} ∣∣ X ∣^{i}$ 。

根据之前柯西不等式的变形有：

$i = 0 \sum d ∣ a_{i} ∣∣ x_{0} ∣^{i} \leq i = 0 \sum d ∣ a_{i} ∣∣ X ∣^{i} \leq d + 1 ∣∣ b_{F} ∣∣$

因此当 $∣∣ b_{F} ∣∣ < \frac{M}{d + 1}$ 时，有 $∣ F (x_{0}) ∣ < M$ 。

于是有： $- M < F (x_{0}) < M$ 。又因为： $F (x_{0}) \equiv 0 (mod M)$ ，因此 $F (x_{0}) = 0$ 。

这个定理（简称 HG 定理）对于估计根的界非常重要！！

之前 example 1 中 $G (x)$ 是直接给出的，下面介绍一下 G(x) 到底该怎么找？首先考虑 $d$ 个多项式 $G_{i} (x) = M x^{i} (0 \leq i < d)$ ，还有 $F (x)$ 。显然它们均有解 $x = x_{0} (mod M)$ ，因此我们对其进行线性组合之后它们仍然有解 $x = x_{0} (mod M)$ 。

谈到线性组合，那么就很容易联想到矩阵，我们讲这些式子的系数向量组合写成矩阵：

$L = M 0 ⋮ 0 a_{0} 0 m X ⋮ 0 a_{1} X \dots \dots ⋱ \dots \dots 00 \dots M X^{d - 1} a_{d - 1} X^{d - 1} 00 \dots 0 X^{d}$

其中 $X$ 是 $x_{0}$ 取值的上界。

由于是下三角矩阵，则矩阵的行列式为： $det L = M^{d} X^{d (d + 1) /2}$ 。

我们对这个矩阵利用 LLL 算法进行格基规约，设规约后的第一行行向量为： $b^{'}$ 。根据 LLL 算法第一个性质有： $b^{'}$ 满足 $∣∣ b^{'} ∣∣ \leq 2^{\frac{n - 1}{4}} det (L)^{\frac{1}{n}}$ 。因此 $∣∣ b^{'} ∣∣ \leq 2^{\frac{d}{4}} M^{\frac{d}{d + 1}} X^{\frac{d}{2}}$ 。

为了满足 HG 定理，使得规约之后的向量（ $G (x)$ 的系数）“足够小”，使得我们可以很快的求出根，故要求 $2^{\frac{d}{4}} M^{\frac{d}{d + 1}} X^{\frac{d}{2}} < \frac{M}{d + 1}$ ，移项之后有： $2^{\frac{d}{4}} d + 1 X^{\frac{d}{2}} < M^{\frac{1}{d + 1}}$ 。如果 $d = 2$ ，则 $X \approx M^{1/3}$ ；如果 $d = 3$ ，则 $X \approx M^{1/6}$ 。

至此我们大致有了 $X$ 的取值范围，但还没达到前面给出的结论 $M^{\frac{1}{d} - ϵ}$ 的程度。因此格子还有继续优化的空间。

Example 2

设 $M = 10001$ ，多项式 $F (x) = x^{3} + 10 x^{2} + 5000 x - 222$ 。【这里根 $x_{0} = 4$ ，因此满足 $x_{0} < M^{\frac{1}{6}}$ 】

这里我们初步构想 $X = 10$ ，则构造格子：

$L = M 00 - 222 0 MX 0 5000 X 00 M X^{2} 10 X^{2} 000 X^{3}$

利用 LLL 格基规约之后，我们得到第一行向量为： $(444, 10, - 2000, - 2000)$ ，消去 $X$ 我们得到最终的系数 $(444, 1, - 20, - 2)$ ，在对这个多项式采用牛顿迭代法求根即可。

from sage.rings.polynomial.refine_root import refine_root
M = 10001
X = 10
L = matrix(ZZ, 4, 4)
for i in range(3):
    L[i, i] = M * X ^ i
L[3, 0] = -222
L[3, 1] = 50000
L[3, 2] = 1000
L[3, 3] = 1000

v = L.LLL()[0]
# print(v)

p = 0
x = polygen(ZZ)
for i, coef in enumerate(v):
    p += (coef / X ^ i) * x ^ i
    
ans = p.roots()
# [(4, 1)]

最终得到的结果就是我们预想的 $x_{0} = 4$ 。

Full Coppersmith Method

回顾一下 Example 2，即使以 $M^{\frac{1}{6}}$ 来计算边界，那么应该在 $4.3$ 左右，那么为什么我们取 $X = 10$ 也能计算出正确结果？而且，如果把 $d = 3$ 代入 $2^{\frac{d}{4}} d + 1 X^{\frac{d}{2}} < M^{\frac{1}{d + 1}}$ ，那么 X 的边界值应该在 $2.07$ 左右。所以为什么我们能得到正确结果呢？

因为其实这个边界值也并不是很严格，在推导得出这个值的时候本身就用了很多次不等式，再者，我们利用的LLL中的那个性质，我们取的是 LLL 算法规约出来的最坏的情况，而大多数情况得到的结果要比这值小许多。

回到不等式： $2^{\frac{d}{4}} M^{\frac{d}{d + 1}} X^{\frac{d}{2}} < \frac{M}{d + 1}$ ，再往前还原是： $2^{\frac{n - 1}{4}} M^{\frac{d}{n}} X^{\frac{d}{2}} < \frac{M}{n}$ ，其中 $n$ 是格的维度。

观察这个不等式，我们发现，要增大 $X$ ，有两种方案：1. 增大 $n$ ；2. 增大 $M$ 。

针对第一种方案，我们称往格里增加的格的维度，而不增加 $M$ 的多项式为 x-shift polynomial。它们是 $x F (x), x^{2} F (x), \dots$ 。显然这些多项式的解都为 $x_{0}$ 。

第二种方案，可以增加 $F (x)$ 的幂次来增加 $M$ 。由于 $F (x_{0}) \equiv 0 (mod M)$ ，则有 $F^{k} (x_{0}) \equiv 0 (mod M^{k})$ 。

在 Example 2 中，我们的格子的维度为 $n = 4$ ，我们带入不等式 $2^{\frac{n - 1}{4}} M^{\frac{d}{n}} X^{\frac{d}{2}} < \frac{M}{n}$ ，得到 $X \approx 2/07$ 。现在我们往格子里添加 x-shift polynomials ，新的格子为：

$L = M 00 - 222 00 0 MX 0 5000 X - 222 X 0 00 M X^{2} 10 X^{2} 5000 X^{2} - 222 X^{2} 000 X^{3} 10 X^{3} 5000 X^{3} 0000 X^{4} 10 X^{4} 00000 X^{5}$

现在格子的维度为 $6$ ，再代入不等式，我们得到 $X \approx 3.11$ 。确实增大了 $X$ 。

一个现成的结论是：当我们给格子增加 x-shift polynomials，可以使得 $X \approx M^{\frac{1}{2 d - 1}}$ 。那么如果当我们使用第二种方案继续增加 $X$ 呢？

Coppersmith 定理

设 $0 < ϵ < min {0.18, \frac{1}{d}}$ ， $F (x)$ 是 $d$ 次首一多项式，如果在有限域 $M$ 下，有一个或多个根满足 $∣ x_{0} ∣ < \frac{1}{2} M^{\frac{1}{d} - ϵ}$ ，那么我们就可以在与 $d, \frac{1}{d}, lo g (M)$ 相关的多项式时间内找到它。

证明过程省略（如果实在没找到过程可以找我一起探讨）。现成的结论：Coppersmith’ Method 的大致时间复杂度为： $O ((\frac{1}{ϵ})^{9} lo g (M)^{3})$ 。

既然气氛烘托到这，那么出道趣味题让大家练练手吧!

设 $p = 2^{30} + 3, p = 2^{32} + 15, M = pq, F (x) = 1942528644709637042 + 1234567890123456789 x + 987654321987654321 x^{2} + x^{3}$ ，并且告诉我们 $x_{0} \leq 2^{14}$ 。请解出 $x_{0}$ 。【不要用中国剩余定理，用构造格的方法。答案是：16384】

4. Attack

介绍 Coppersmith’ Method 这个寻小根算法之后，我们在来回到如果攻破改进之后低公共指数的 RSA 加密系统。

假设 $N_{1}, N_{2}, \dots, N_{k}$ 是 $k$ 个互素的整数。设 $N_{min} = min N_{i}$ ， $g_{i} \in Z_{N_{i}} [x]$ 为最大阶为 $d$ 的多项式。假设存在唯一的 $M < M_{min}$ ，使得 $g_{i} (M) \equiv C_{i} (mod N_{i})$ 都成立。那么。如果 $k \geq d$ ，可以有效的从 $(N_{i}, g_{i}, C_{i})_{i = 1}^{k}$ 中找到 $M$ 。

其中 $g_{i}$ 就对应“改进后”的低公共指数的 $m + 2^{k} I D$ 。它是一个低阶多项式，可以使用 coppersmith’ method 找到那个根 $m$ 。

不久我会单独整理一份 jupyter notebook 用于记录 RSA 加密系统中的那些“高明”的攻击技巧。

签名是不是一种零知识证明?

一般的数字签名应该不属于interactive proof 因为不具有soundness的性质也就不属于ZKP 但是比如schnorr签名存在soundness的性质是一个zkp

@洪澄: 首先得看是对什么信息的签名，如果是对有意义的信息比如文档，聊天记录的签名那就不是零知识的，因为这个签名本身就算是一个额外的知识。

至于对于随机挑战的签名是不是对于“我有某个公钥对应的私钥”的zkp，是难于blackbox的分析的，得描述协议再论证。例如schnorr确实是。

@Kurt: Schnorr签名不存在soundness性质，要求的是「不可伪造」性质，但是Schnorr identification protocol (Sigma protocol）具有special soundness性质（和HVZK性质）

零知识证明是不是一种多方计算?

[TODO]

图灵机电路计算模型

CPU就是一个用（布尔门）电路模拟出来的通用图灵机，机器指令就是用门电路逻辑实现的，FPGA就是再用电路去模拟特定的图灵机。但谁说图灵机必须要用到电路？图灵机只是个计算模型，我用纸带和笔也能构造出来一台通用图灵机，再比如你不知道外星人是不是也用门电路来做“CPU”，但邱奇-图灵论题就认为全宇宙的计算模型都一定会和图灵机等价。反过来说图灵机也可以用来模拟电路，Verilog语言以及量子电路编程语言都是这类。 Lambda Calculus也是另一个图灵完备的计算模型，日本过去的“五代机”计划就是在用集成电路直接实现Lambda Calculus计算模型的机器。图灵完备的计算模型还有很多好玩的呢，比如递归函数，比如元胞自动机/生命游戏。 SNARK里道理也是一样，只是一般的target是VM这一级别，当然zkCPU理论上也没问题，再当然人脑通过训练学习去成为人工zk编译器也没啥不可能。

信任机器如何体现

自从 2016年《经济学人》提出来的「区块链是信任机器」的说法，我就在一直思考这个问题：「信任机器」如何体现。自从深入思考零知识证明以后，我慢慢发现他们殊途同归，只是各自的维度不一样，区块链解决的是「分布式计算的信任」，零知识证明解决的是「数据的信任」。如果再加上形式化验证，就可以解决「逻辑的信任」。

这三个点：逻辑 <-> 计算 <-> 数据 才真正构成了一个闭环，也许才能真正实现「信任机器」这一构想。

ref: https://secbit.io/blog/2019/07/14/zkpod-short-intro/#back-to-top

Kurt :

「计算」是对「数据」/「信息」的处理/变换过程；

「证明」是对「命题」/「符号」的推理/推导过程；

「逻辑」是正确的「推理」过程；

「程序」是写出来的「计算」过程（「算法」）；

「证明」是写出来的「逻辑」（「推理」）过程；

「知识」是「计算能力」；

Von Neumann architecture: 程序 == 数据；

Curry–Howard isomorphism: 程序 == 证明；

所以「证明程序的integrity」== 「证明推理符合正确的逻辑」

因为程序==证明，所以「formal verification」可以在计算机里实现。verification也是计算，但是是符合逻辑系统推理规则的计算过程（程序）；

「witness」就是「non-determinism」计算中的计算路径信息；「proof」就是「witness」的压缩编码；

NP-proof system中，proof generation 计算过程就是 verification计算过程的 non-deterministic version；

ZK-proof system相比而言添加了对witness的压缩编码。

那是不是说明zkproof的生成和验证过程就是formal verification?

本身不formal （formal的意思是符合特定逻辑系统，我不认为PIOP这种模型目前能达到formal的程度），要加 typing rule/ dynamic semantics rule等等。比如见： https://eprint.iacr.org/2023/657.pdf

就是说零知识证明只能保证计算的完整性，如果你一开始写的智能合约逻辑就错了，就有漏洞的话，还还是一个有bug的合约。形式验证应该是可以保证算法逻辑就是正确的没有漏洞？

是的，计算完整性和计算正确性是两个东西：计算完整性是保证计算的「输出」是正确的（是和计算一致的），计算（语义）正确性是说计算本身是无bug的。（ZKP里的completeness是说真命题可以生成有效证明；MPC里的correctness是说协议可以正确实现functionality）

FV 形式化验证可以使用逻辑模型对程序逻辑进行部分检验，可以排除常见bug，但通用debugger是不存在的（因为「图灵停机问题不可判定」）。

R1CS

r1cs 的基本公式是 AX*BX=CX，* 是hadmard product，X是变量向量。请教一个基本问题是，r1cs里的r1，是否指某个matrix的rank=1？如果是，那么是哪个矩阵的秩为1?

这里的秩1约束实际上和组合优化/凸优化里面的秩1约束是一个东西。实际上就是说这里的约束条件 $(x^{T} * A) (B^{T} * x) + C^{T} * x$ 是秩1的。其实就是 $r ank (A B^{T}) = 1$ ，因为A B都是向量。

正解，我再来重述一遍：考虑一个约束 $(a^{T} x) (b^{T} x) - (c^{T} x) = 0$ ，乘法部分可以重写为 $(x^{T} a) (b^{T} x) = x^{T} (a b^{T}) x$ ，即为变量为 x 的「二次型」。而矩阵 $(a b^{T})$ 的秩一定为1 （ $R ank (a b^{T}) = 1$ ），因为向量 outer product 生成的矩阵每一列都线性依赖（正比）于特定一列（比如第一列），其rank一定等于1。这就是Rank 1的由来。

那么non-rank1 constraint指什么？

区分两个概念：rank-1 constraint vs degree-2 constraint。最终只出现一次乘法的都叫deg2 constraint，但只有二次型矩阵M=(ab^T)的才叫rank1 constraint。换句话说，一个deg2 non-rank1 constraint就是二次型矩阵M的秩大于1的情况（就不对应于一个fan-in 2的算术电路乘法门了），比如rank=2时可以称之为R2CS。Justin的意思是R1CS真正的局限并不在于没有R2CS不能custom constraint，而是在于不支持higher degree (>2) constraint，比如fan-in > 2 的乘法门。

能举个degree2+non rank1 的例子？

因为rank1就已经可以对fan-in 2 算术电路（的乘法门）进行约束了，那么在算术电路语境下就一定举不出来一个“例子”，因为没有必要性。二次型x^T M x的矩阵M并没有限制rank=1，所以rank>1也一定可以表示某种约束，只不过不是对算术电路的约束。也许可以举出凸二次优化里的例子，但我并不熟悉。

extractor

Prover是一个黑盒，extractor以任意方式(包括存档取档)“把玩”这个黑盒，最后能提取出witness，这说明黑盒里面真的有witness。

整个目的是为了要证明证明者真的有witness，毕竟都能抽取出来

怎么理解 zk 的前后端?

有两种解释：

前端=算术化/后端=证明系统
前端=密码学编译器（比如多项式承诺）/后端=信息论证明系统（比如IOP）

yingtong有一个讲义在论述这个 proof system的stack https://assets.super.so/9c1ce0ba-bad4-4680-8c65-3a46532bf44a/files/e11309fb-7356-42ad-9c78-565341abd80d.pdf

我是在想，或者说我的观察是，一旦一种表达形式确定了，它的 iop 基本上也被框定的，比如说AIR，可能就是FRI，假如转换成 pair based 大家会觉得我有病

why Knowledge soundness is not a meaningful notion for the sumcheck protocol?

好问题！直观上说是因为 sumcheck 要证的statement 没有(多项式长度的）witness，要证的就是一个evaluation 的 summation = a value，verifier 有本事自己也能自己算一遍（可惜一般他没有这种计算能力）。往深了说KS抽取一个witness这件事有一个前提，就是要「存在」一个多项式长度的witness，这正是NP的定义，所以一般KS性质都是针对NP语言内的讨论。而sumcheck可以证的语言比如UNSAT/#SAT/TQBF，这三个语言都不是NP的（分别属于coNP/ #P/ PSPACE)。

什么 snark 协议需要 Knowledge sound，哪些只需要sound就够了

直观上说是因为sumcheck要证的statement里没有(多项式长度的）witness，要证的就是一个evaluation 的 summation = a value，verifier有本事自己也能自己算一遍（可惜一般他没有这种计算能力）。往深了说KS抽取一个witness这件事有一个前提，就是要「存在」一个多项式长度的witness，这正是 NP 的定义，所以一般KS性质都是针对NP语言内的讨论。而sumcheck可以证的语言比如 UNSAT/#SAT/TQBF ，这三个语言都不是 NP 的（分别属于 coNP/#P/PSPACE )。
证明a statement is true和我「知道」「为什么」this statement is true中间是有gap的；反过来后者KS蕴含soundness，我「证明statement is true+证明知道为什么statement is true」蕴含「证明statement is true」。
去证明一个「数学定理」is true的时候，验证者其实不太关心一定要知识抽取的，只要让我相信定理is true就够了，上面sumcheck证的语言都是这种。
而对于KS必需的情况举一个例子：对一个地址，我用SNARK证明了对应的私钥（比如离散对数或哈希原像）是「存在」的。这完全不能用！我得去证明我「知道」这个地址相对应的私钥（而不仅仅是私钥存在），我才能去发起交易。
此外还有的情况下，KS性质都是不够的！比如可以对不包括在约束中的instance更改以进行malleability attack。如果还要在这种攻击存在下依然安全，那要满足simulation extractability (SE性质)。（UC-secure imply SE)。SE最新相关内容有一篇欧密23的文章 Spartan and Bulletproofs are Simulation-Extractable (for Free!)

注： malleability attack 可见 the halo2 book

zk-everything

零知识证明由于其本身陡峭的入门学习曲线，往往被初学者称为moon math。为了平缓学习曲线，减轻入门压力，babysnark[1]应运而生，本文将作为babysnark原理部分的一个解读版，帮助你更好的理解snark背后的一些基本概念和直觉。在阅读本文之前，希望你已经读过# 从零开始学习 zk-SNARK系列的前4部分，对包括有限域、椭圆曲线等相关知识有一个基本的了解。

R1CS

比如我们有这样一段程序：

def qeval(x):  
	y = x**3  
	return x + y + 5

我们知道程序执行实际上是CPU中的乘法门和加法门组合运算得到的。那么上面的程序可以看成是类似是下面的这个图，有一些输入变量和中间运算过程，最后得到输出。

alt_text

为了更好的表示中间过程是如何执行的，我们需要将上述程序拆分写成如下形式，左侧是中间运算的输出结果，右侧可以看成中间运算的输入：

sym_1 = x * x  
y = sym_1 * x  
sym_2 = y + x  
~out = sym_2 + 5

为什么我们输入一定要写成两个变量而不能是三个或者多个变量呢？具体限制原因可以从限制运算[3]中找到答案。简单来说，多项式的算数性质有在某一个具体的点上，左操作数和右操作数相乘等于输出结果。而这个约束特点使得每一次输入只能是两个数的形式，如果一次有多个变量作为输入，可以分别将其拆分成两两组合。

有了这样的直觉之后我们可以来看一下R1CS（Rank 1 constraint system）的具体定义:

给定三个m行n列的矩阵 $A, B, C \in F^{m \times n}$ , 和一个 $n$ 维向量 $s \in F^{n}, R 1 CS$ 定义了一组m个方程，每个方程的形式如下:

$(A \cdot s)_{i} \cdot (B \cdot s)_{i} = (C \cdot s)_{i}$

其中 $i = 1, 2, \dots, m$ , ·表示矩阵和向量的乘积, $(A \cdot s)_{i}$ 表示 $A \cdot s$ 的第 $i$ 个元素。等价地，我们可以使用Hadamard积（逐元素相乘）来表示整个系统：

$A \cdot s \circ B \cdot s = C \cdot s$

其中○表示Hadamard积。

其中A可以看作是左操作数的全局结果的矩阵表示，B可以看成是右操作数全部结果的矩阵表示。C是运算结果的全部结果的矩阵表示。接下来让我们一步一步将上述4个等式转变成矩阵的Hadamard积的形式。

假设我们将上述4个等式的输入输出变量按如下顺序排列：

'~one', 'x', '~out', 'sym_1', 'y', 'sym_2'

那么对于第一个等式

sym_1 = x * x

左操作数a，右操作数b和最后结果c可以分别表示成如下向量形式

a = [0, 1, 0, 0, 0, 0]  
b = [0, 1, 0, 0, 0, 0]  
c = [0, 0, 0, 1, 0, 0]

然后向量和上述6个变量相乘，就可以还原出第一个等式了。类似的，我们对等式2，3，4做同样的处理，最终可以得到矩阵A,B,C:

A  
[0, 1, 0, 0, 0, 0]  
[0, 0, 0, 1, 0, 0]  
[0, 1, 0, 0, 1, 0]  
[5, 0, 0, 0, 0, 1]

B  
[0, 1, 0, 0, 0, 0]  
[0, 1, 0, 0, 0, 0]  
[1, 0, 0, 0, 0, 0]  
[1, 0, 0, 0, 0, 0]

C  
[0, 0, 0, 1, 0, 0]  
[0, 0, 0, 0, 1, 0]  
[0, 0, 0, 0, 0, 1]  
[0, 0, 1, 0, 0, 0]

通过上述操作，我们就将一段程序转换成了R1CS的形式。

多项式插值

在实际的零知识证明系统中，不管具体零知识证明算法是哪种，总要有一个validator发出一个随机数作为challenge，然后prover接受这个随机数作为系统输入，然后返回一个输出结果。validator拿到输出结果看是否和挑战的随机数满足某种对应关系，如果满足就认为prover确实掌握了某种知识。为了实现validator可以找任意随机数，所以我们就有必要R1CS的约束关系转换成多项式的形式。

比如对于之前的矩阵A而言，如果竖着按列看，其实其对应的就是之前文中所说的6个变量

'~one', 'x', '~out', 'sym_1', 'y', 'sym_2'

比如说，对于one变量而言，其在上述4个等式（即4种约束关系）中所组成的向量为

~one: [0, 0, 0, 5]

如果将其在笛卡尔坐标系中表示，假设我们选取x为1，2，3，4，那么该one所组成的多项式应该经过(1,0), (2,0), (3,0), (4,5)这4个点。在笛卡尔坐标系中，我们对于做操作数和有操作数以及结果的所有x坐标只要满足一致关系，他们所组成的多项式都满足R1CS约束关系。基于上述特点，我们可以对6个变量选定一致的x坐标然后使用插值的方式得到多项式的形式。下面是我们选定x坐标是1，2，3，4得到的矩阵A的多项式表示形式：

A polynomials  
[-5.0, 9.166, -5.0, 0.833]  
[8.0, -11.333, 5.0, -0.666]  
[0.0, 0.0, 0.0, 0.0]  
[-6.0, 9.5, -4.0, 0.5]  
[4.0, -7.0, 3.5, -0.5]  
[-1.0, 1.833, -1.0, 0.166]

即one可以表示为：

$0.833 x^{3} - 5 x^{2} + 9.166 x - 5$

其他变量的R1CS转换也同理。

QAP

这种转换成的多项式新形式称之为QAP（Quadratic Arithmetic Program）我们来看一下QAP的具体定义。

定义(QAP): 一个在域 $F$ 上的二次算术程序 $Q$ 包含三种 $m + 1$ 多项式：

$V = {v_{i} (x)}$
$W = {w_{i} (x)}$
$Y = {y_{i} (x)}$ 其中 $i \in {0, 1, \dots, m}$ ，以及一个目标多项式 $t (x)$ 。

假设 $F$ 是一个算术程序，它以 $n$ 个 $F$ 的元素为输入并输出 $n^{'}$ 个元素，总共有 $N = n + n^{'}$ 个I/O元素。那么，当且仅当存在系数 ${c_{N + 1}, \dots, c_{m}}$ 使得 $t (x)$ 可以整除 $p (x)$ 时， ${c_{1}, \dots, c_{N}} \in F^{N}$ 是 $F$ 的输入和输出的有效赋值，其中：

$p (x) := (v_{0} (x) + i = 1 \sum m c_{i} v_{i} (x)) \cdot (w_{0} (x) + i = 1 \sum m c_{i} w_{i} (x)) - (y_{0} (x) + i = 1 \sum m c_{i} y_{i} (x))$

布尔电路

通常情况下一般的通用snark算法使用的是QAP来去表示程序，但如果程序是一些特殊问题，比如输入程序可以表示为布尔电路，那么QAP实现就可以更加简单一点。首先我们来看一下布尔电路的特点：

alt_text

从图中可以看到不管是哪一种的门，最终的输出结果一定是落在[0, 2]区间之内。具体来说：任何一个2输入的二进制门电路 $g (a, b) = c$ ，其中输入为 $a, b$ ，输出为 $c$ ，都可以使用门电路的输入和输出的仿射组合 $L = α a + β b + γ c + δ$ 来指定，当输入输出满足门电路的逻辑规范时，它只能取两个值， $L = 0$ 或 $L = 2$ 。这导致了一个等效的单一的“平方”约束 $(L - 1)^{2} = 1$ 。

SSP

根据上述布尔电路的特点，一般的QAP约束在布尔电路中就转换成了SSP（Square Span Program）约束。我们来看一下SSP的具体定义：

定义(SSP)：在域 $F$ 上的一个方形跨度程序(SSP)是由 $m + 1$ 个多项式 $v_{0} (x), \dots, v_{m} (x) \in F [x]$ 和一个目标多项式 $t (x)$ 组成的元组，使得对所有 $i = 0, \dots, m$ ，都有 $deg (v_{i} (x)) ⩽ deg (t (x))$ 。我们说方形跨度程序SSP的大小为 $m$ ，并且度数为 $d = deg (t (x))$ 。当且仅当存在 $c_{N + 1}, \dots, c_{m} \in {0, 1}$ ，使得 $t (x)$ 能够整除 $p (x)$ 时，我们称SSP接受输入 $c_{1}, \dots, c_{N} \in {0, 1}$ ，其中：

$p (x) := (v_{0} (x) + i = 1 \sum m c_{i} v_{i} (x))^{2} - 1.$

我们说SSP校验了布尔电路 $C : {0, 1}^{N} \to {0, 1}$ ，如果它仅接受那些满足 $C (c_{1}, \dots c_{N}) = 1$ 的输入值 $(c_{1}, \dots, c_{N}) \in {0, 1}^{N}$ 。

再进一步，我们可以根据SSP而具体的布尔电路构造方形约束系统(Square Constraint System)。我们首先来看一下SCS的定义：

定义SCS: 方形约束系统由一个矩阵 $U : F^{m \times n}$ 定义。如果满足以下条件

$(U a) \circ (U a) = 1,$

其中 $\circ$ 表示Hadamard（逐元素）乘积，那么向量 $\overset{a}{¨} : F^{m}$ 是此系统的解。我们也将 $(U a) \circ (U a)$ 写为 $(U a)^{2}$ 。

我们可以看一个具体的例子，比如我们有3个布尔元素分别是 $a, b, c$ ：对于布尔元素而言，比如说 $a$ 要么为 0，要么为 1。注意到

$(2 a - 1)^{2} = 1$

这意味着 $(2 a - 1) \in {- 1, 1}$ ，从而推导出 $a \in {0, 1}$ 。其他元素也是同理。对于 $c = \neg (a \land b) = NAND (a, b)$ 为

$(2 a + 2 b - 5 c + 4)^{2} = 1.$

综合上述内容，一个包括上述导线和门的方形约束程序将采取以下形式：

$- 1 - 1 - 1 4 ⋮ 2222 2 - 5 \dots ⋱ \cdot 1 a b c ⋮^{2} = 1 .$

babysnark

介绍了这么多，终于到babysnark了。babysnark是对布尔电路所构造的一种snark。相比于QAP而言，SSP更简单，所以实现整个snark所需的约束也更少。具体来说一共有两个约束，第一个是SSP约束：

$H (\cdot) t (\cdot) = V (\cdot)^{2} - 1$

不需要做太多解释，第二个约束是线性约束：

$B_{w} (\cdot) = Y V_{w} (\cdot)$

这个和babysnark具体设计有一些关系。 $V_{w}$ 的值是由prover直接计算的，而 $B_{w}$ 的值来自于setup阶段。设置线性约束的目的是确保 $V_{w}$ 确实是由同一线性多项式计算出来的，防止prover作弊，恶意构造 $V_{w}$ 而不是赖在setup所提供的随机challenge构造的 $V_{w}$ ，最终破坏SSP约束。因为prover最后输出证明的时候同时提供了 $B_{w}$ 和 $V_{w}$ 在verify阶段添加 $γ$ 是为了防止证明者输出特别恶意构造的 B=YV，所以再做一次线性约束。

babysnark的随机挑战 $τ$ 采用的是 $[1, τ, \dots, τ^{m}]$ 的形式，该构造形式的安全保证来自q-DLOG 假设。q-DLOG 假设确保即使敌手可以在多个点上观察到多项式的值，他们也无法从多项式的结构中提取任何信息。

至此，我们对babysnark的原理部分做了详细的探讨。希望通过深入浅出的方式介绍这一简易的snark，能为你的零知识证明学习之旅提供坚实的基石。

Reference

[1] BabySnark do do do

[2] quadratic-arithmetic-programs-from-zero-to-hero

[3] 从零开始学习 zk-SNARK（三）——从程序到多项式的构造

[4] zk-SNARKs: A Gentle Introduction

KZG

KZG 承诺又叫做 KZG10 承诺,是由 Kate, Zaverucha, and Goldberg 三位作者共同提出.

1.多项式表示

多项式 P(x)可以用系数表述,如 $p (x) = 6 x^{5} + 0 x^{4} + 0 x^{3} + 0 x^{2} + 0 x^{1} - 55$ 简单可表示为

$p (x) = 6 x^{5} - 55$ ,所以对于一个多项式 P(x)可以表示为 $\sum_{0}^{n} c_{i} x^{i}$ ,其中 $c_{i}$ 表示对应位置的系数.

2.Commitment Scheme

2.1 Commit Schemes 过程：

可以把承诺 C(m)理解为一个装着信件 m 的信封

Setup 阶段产生一些公共参数
Commit 阶段:对消息 m 进行承诺得到 C(m)
Open 阶段:打开 C(m)得到 m‘,验证 m是否等于 m’. commit 阶段的 m，在 open 阶段是会暴露的.

2.2 commit Schemes 性质：

Hiding:意味着敌手获得承诺 c(m)后无法获得 m 的值
- computational hiding:对于任意的 PPT 敌手 A.有
- Perfect hiding:将 A 的计算能力修改为无穷算力,“≤ negl(λ)”替换为 0
Binding:是指一个承诺 c(m) 在 Open 阶段打开只会得到 m 而不会得到 m‘.
- computational Binding
- perfect binding::将 A 的计算能力修改为无穷算力,“≤ negl(λ)”替换为 0

2.3 Polynomial Commitment Schemes：PCS

多项式承诺 PCS:承诺对象是单变量多项式, $f (X) \in F_{p}^{(\leq d)} [X]$ :表示所有 degree 最多为 d 的单变量多项式的集合。过程可总结如下图

Prover 运行 Commit 算法,将函数 f 与随机数 r 作为输入, $co m_{f}$ 为输出.将 $co m_{f}$ 发送给 Verifier
Verifier 发送一个挑战点:即一个函数域 X 中的元素 x
Prover 将 x 对应的 f(x)=y,以及 proof $π$ 发送给 Verifier. $π$ 表明 1.f(x)=y 2.f 属于 F,即 f 的 degree<=d.

其中 Prover 需要计算如下内容

多项式的承诺 C=[P(x)]
多项式在 z 点的值,P(z)=y,这很简单
the proof $π$

PCS 有多种,比如 FRI or Dark’20 or Dory’20 .但是 KZG 仍然是目前实践中使用最为广泛的 PCS 方案.其特点如下

基于 Pairing 实现
Proof size 是常量 (一个椭圆曲线群元素)
验证时间是常量 (两次 pairing 操作)

其中特性 2 与 3 导致可以将其构造成一个 SNARK 方案.SNARK 的全称是 Succinct Non-interactive Argument of Knowledge:简洁非交互式知识论证.

SNARK 要求 1.size of proof=O(log(d)) 2.time of Verification =O(log(d)),d 为 degree of Polynomial.

进而可以将 KZG 应用在零知识证明系统如 ZK-SNARK 中.

3.计算多项式的承诺 C

在计算之前,首先介绍两个概念

3.1 椭圆曲线(EC)

这里只简单提一下椭圆曲线,更多细节可参考阅读 basic elliptic curve cryptography series.

假设 $G$ 是由椭圆曲线点构成的群,g 是 $G$ 的生成元.

用符号[x]表示 $g^{x}$ .由于椭圆曲线的离散对数难题,给定 g 与[x],但无法逆推出 x.

3.2 Trusted Setup

对多项式进行承诺,需要一个与多项式系数数量一样长的 structured reference string（SRS）。该字符串必须按照指定的方式生成，并提供给任何希望承诺多项式的参与方。生成过程会产生一个秘密值 s,也称为 trapdoor 或者 toxic waste），必须将 s 其丢弃。换句话说，生成参考字符串的任何一方都知道一个信息片段，该信息可以破坏多项式承诺方案的 binding 性质，从而破坏使用该承诺方案的任何证明系统的正确性。生成这样的 SRS 过程被称为可信设置（trusted setup).

设 D 是希望支持承诺的多项式 P(x)的最高次数上界, SRS = $(g, g^{s}, g^{s^{2}}, \dots, g^{s^{D}})$ .

目前主流是通过 Ceremony 生成 SRS,关于 Ceremony 的详细细节可参考 https://mirror.xyz/privacy-scaling-explorations.eth/naTdx-u7kyirczTLSAnWwH6ZdedfTQu1yCWQj1m_n-E

Ceremony 的思想与 MPC 类似，让 N 名参与者生成自己的秘密，并按顺序将其添加到主秘密中。只要有一个参与者不泄露秘密，那么主秘密就是安全的。主秘密的生成过程被称为 Ceremony.

可进入 https://ceremy.ethereum.org 参与以太坊社区组织的 KZG Ceremony 的生成过程,成为其中一名贡献者!

3.3 combine Trusted Setup and EC

Trusted Setup 阶段生成 SRS=( $[s^{0}], [s^{1}], [s^{2}] \dots [s^{n}]$ ),n 为 P(x)的 degree.然后将 s 丢弃。任何人都可以访问 SRS，但是无法获得 s 本身.
通过 SRS 重新构造多项式 P(x)为[P(s)],而不会暴露 s 与多项式本身

$[P (s)] = [\sum_{i = 0}^{n} c_{i} s^{i}] = \sum_{i = 0}^{n} c_{i} [s^{i}]$

上式中，用秘密 s 替换自变量 X,得到 P(s):因为自变量 x 可以表示为任何值,.这不影响多项式本身.进而得到承诺 C=[P(s)]

4.计算 proof

我们需要 proof $π$ 证明 P(z)=v.构造 $π$ 前先引入一些 polynomial math.

P(x)的零点为 m，即 P(m)=0.那么 P(x)一定能整除（x-m),即存在一个商多项式 q(x).使得

$> P (X) = (X - m) * q (x) >$

想要证明的是 p(z)=v,结合上述 polynomial math.可做如下变换.

p(X)-v=0 when X=z,则 p(X)-y 能整除(X-z) ,即 $q (X) = \frac{P ( X ) - v}{X - z}$ ,即 $π = q (s) = \frac{P ( s ) - v}{S - z}$ .

也把 q(X)称为**“Witness Polynomial”**

对于 $p (s) - v = q (s) (s - z)$ ,不能直接利用这个等式,因为等式中的**s **两方都不知道

直觉上,我们希望直接证明等式 [p(s)-v] = [q(s)*(s-z)]成立,从而完成验证.

等式左边:

承诺仅满足加法同态: $[p (s)] + [q (s)] = [p (s) + q (s)]$ ,所以[p(s)-v]=[p(s)] -[v]

等式右边:

在验证过程中,验证方会收到证明方发来的[p(s)] ,同时验证方自己可以计算[s-z]=[s]-[z]的值

但是由于椭圆曲线上不满足乘法,即乘法****同态:[p(s)]*[q(s)] =[p(s)*q(s)]

所以等式**[q(s) * (s-z)]= [q(s)]*[s-z]** 并不成立,需要引入配对 pairing。

因为椭圆曲线上的运算是一个加法群，而不是一个乘法群，乘法没有被定义。

这里需要强调的是，单个运算结构其实并不区分加法乘法，a o b 这个 o 把它称作成什么都行只是在有限域上的椭圆曲线点集构成一个加法群，把它称为加法是更符合习惯。我们区别加法与乘法，比如两种运算的代数结构比如环，域。因为有两种运算，需要做区分，因为涉及到分配律，谁对谁分配的问题，所以会很明确的区分加法与乘法。

5.Pairing

Pairing is **a bilinear mapping.深入学习Pairing可参考《Pairing for beginners》**这本书,在这里只做简单介绍.

bilinear
- Linearity:对于某些一元函数,如果该函数服从 $f (a r_{1} + b r_{2}) = a f (r_{1}) + b f (r_{2})$
- Bilinearity:对于二元函数,Linearity 存在于所有维度中,即

$f (a r_{1} + b r_{2}, s) = a f (r_{1}, s) + b f (r_{2}, s), f (r, a s_{1} + b s_{2}) = a f (r, s_{1}) + b f (r, s_{2})$

bilinear mapping 双线性映射是一个函数,它从两个向量空间的元素产生第三个向量空间的元素,每个参数都是线性的.

5.1 about pairing

配对是⼀种抽象操作。其定义可能会有所不同。有 Tate 配对、Weil 配对、Ate 配对等等…… 虽然每⼀个都通过不同的操作来定义配对,但是Input与output的格式,pairing 的属性都是固定的.

Input:

output：

n 阶乘法群 $G_{T}$ 中的整数（或复数)

$e (G_{1}, G_{1}) ， e (G_{1}, G_{2})$ 分别是对称与非对称的 Pairing 形式。在实际中，非对称 Pairing 效率最高。

properties：

e(P, Q + R) = e(P,Q) * e(P, R)
e(P + S, Q) = e(P,Q) * e(S, Q)
$e (a P, b R) = e (P, R)^{ab} = e (P, b R)^{a} = e (a P, R)^{b} = e (b P, a R)$ (bilinear)
e(P, Q) ≠ 1 (non-degeneracy property)

5.2 Pairing examples

1.e(x, y) = 2ˣʸ

例: 请举例在实数域中 e(x, y) = 2ˣʸ 是双线性函数.

e(3, 4 + 5) = 2³˙⁹ = 2²⁷
e(3, 4) * e(3, 5) = 2³˙⁴ * 2³˙⁵ = 2¹² * 2¹⁵ = 2²⁷.
通过 pairing 证明知道 x² - x - 42 = 0 的解, 然而并不透露这个解的具体数值.

如果 $e (G, G)^{k} = 1$ 成立, 那么 k 必须为 0 或者目标群的倍数.

如果存在 $e (G, G)^{(x^{2} - x - 42)}$ , 可以确定原始二次方程式成立. 使用双线性性重写方程 $e (G, G)^{(x^{2})} \cdot e (G, G)^{(- x)} \cdot e (G, G)^{(- 42)} = 1$ .进一步,e(xG, xG) ⋅ e(xG, -G) ⋅ e(G, -42G) = 1.

因此只需要提供 xG 的值. 同时由于椭圆曲线的离散对数问题, 从 xG 反推回 x 是困难的.

2.解决 Diffie-Hellman 难题

3.BLS签名

6.KZG

回到KZG部分

$G_{1}, G_{2}$ 分别是同一椭圆曲线的两个子群.g 是子群 $G_{1}$ 的生成元,h 是子群 $G_{2}$ 的生成元

生成元的选择通常在 trusted Setup 阶段选择 $[x]_{1} = g^{x}, [x]_{2} = h^{x} .$

define pairing e: $G_{1} \times G_{2} \to G_{T}$ ,对于秘密 s 也相应有两个分布 $[s^{i}]_{1}, [s^{i}]_{2}$ .即SRS

原来要验证的等式： $q (s) \cdot (s - z) = p (s) - v$ => $π_{1} \cdot [s - z]_{2} = C_{1} - [v]_{1}$

分布集1: $[s_{i}]_{1} = g^{s_{i}}$ ，对应生成元为g。计算π、C、 $[v]_{1}$

分布集2: $[s_{i}]_{2} = h^{s_{i}}$ ，对应生成元为h。计算 $[s - z]_{2}$

验证者验证等式： $e (π ， [s - z]_{2}) = ? e (C - [v]_{1}, h)$

简单理解这个等式： $e (π ， [s - z]_{2} ） = e (g^{q (s)} ， h^{s - z}) = e (g, h)^{q (s) \cdot (s - z)}$

$e （ C - [v]_{1}, h) = e (g^{C - v}, h) = e (g, h)^{C - v}$

[x]g 与 g^x 表述形式不同，本质上没有什么区别。 a o b =c 如果群运算定义为加法，就使用[x]g 这种形式如果群运算定义为乘法，就使用 g^x 这种形式

用黑盒来理解这个等式的话，就等价于在 $G_{T}$ 群中去验证下面乘法的成立

$[q (s) . (s - z)]_{T} = [p (s) - y]_{T}$

Verifier 如何进行验算：

prover 发送 $π = [q (s)]$ ,C,v
Verifier 自己选择的 z,根据加法同态,Verifier 可以计算_[s -z]₂=[s]₂ - [z]₂_
g,h is public,pairing function is public.

KZG 完整过程：

通过 Trusted setup, 产生 SRS:[sⁱ]₁, [sⁱ]₂.
Prover 使用_[sⁱ]₁_,对多项式 P(x)进行 commit,得到 C = [p(s)]₁, 发送给 Verifier.
Verifier 选择挑战点_z _∈ {0,…,_p_−1}
Prover 发送 π 、y 给 Verifier:
Verifier 检查等式: _e(π, [s -z]₂) = e(C -[v]₁, H) _— if the equation holds, the verifier accepts the proof — if the equation does not hold, the verifier rejects the proof

KZG 分析

对 KZG 的 Corretness Binding hiding 分别分析

Corretness

$e (π ， [s - z]_{2}) = ? e (C - [y]_{1}, h)$

等式左边: $e (π ， [s - z]_{2}) = e （ g^{q (s)} ， h^{s - z} ） = e (g, h)^{q (s) \cdot (s - z)}$

等式右边: $e (C - [y]_{1}, h) = e (g^{C - y}, h) = e (g, h)^{C - y}$

hiding

因为椭圆曲线的离散对数难题,敌手拿到[x]无法得到 x.

Binding

分析 Binding 前，需要介绍 SDH 假设。

Strong Diffie-Hellman(SDH) 问题定义如下：

给定(q+1)长的元组 $(g^{1}, g^{s}, g^{s^{2}} \dots g^{s^{q}})$ 作为输入，输出 $(g^{\frac{1}{s + x}}, x), x \in Z_{p}^{*}$

SDH假设就是不存在多项式时间算法可以以不可忽略概率解决 SDH 问题。下面用对称形式的 Pairing 进行分析

后续 pairing 的验证都是“g 的指数上”在进行验证,为了方便起见.省略底数 g,后续的等式都是在指数位置上进行.

反证法,即KZG不满足 binding,那么 open 承诺 C 可以得到值 v 和 v’，承诺方必须确定两个不同的值 y 和 y’，使得下列等式成立:

$q (s) - v = w (s) \cdot (s - z), q (s) - v^{'} = w^{'} (s) \cdot (s - z)$

即 $v^{'} - v = (q (s) - w^{'} (s)) (s - z)$

因为 $v - v^{'} \neq = 0$ ,假设 $s \neq = z$ , 等式两边同时除以 $(v - v^{'}) \cdot (s - z)$ 可得:

$\frac{1}{( s - z )} = \frac{q ( s ) - q ' ( s )}{( v - v ' )}$ ,即 $g^{\frac{1}{( s - z )}} = g^{\frac{q ( s ) - q ' ( s )}{( v - v ' )}}$ ,这说明有人可高效计算出 $g^{\frac{1}{s - z}}$ ,这违背了SDH假设.

总结:

像之前说的那样,KZG 方案的 Proof size 是常量 (一个椭圆曲线群元素),验证时间也是常量 (两次 pairing 操作),这是其优点.但是其最大缺点是需要一个 Trusted Setup 阶段.

7.Batch-KZG proof：multi proof

上述过程验证了⼀个在单点上求值的多项式。但如果想证明⼀个多项式上在多点上的值，就必须⼀次⼜⼀次地重复同样的协议 (back and forth)。这显然是没有效率的。为了解决这个问题，需要 “批量 “验证多项式上的点。

假设想证明 k 个点上的值：

通过使用拉格朗日多项式插值法，构造一个经过上述 k 个点对的 k-1 次多项式

n+1 个坐标对的形式可以唯一的恢复出一个多项式

**原多项式 P(x)与构造的 I(x)**都经过 k 个点对，所以多项式 P(x)-I(x)=0 在如下点上满足

即多项式能够整除

定义一个 zero polynomial:

则下式成立

定义 kate multiproof for the evaluation of these points：

验证过程如下：

Verifier 通过 k 个 points(z,y)计算 Z(x)和 I(x)
Verifier 计算 $[Z (s)]_{2}, ［ I (s)]_{1}$
Verifier 验证等式 $e (π, [Z (s)]_{2}) ＝ e (C - [I (s)]_{1}, H)$ 是否成

8.KZG in ZK-Rollup

在 zk-rollups 的情况下,想证明发生在 L2 上的一些计算是有效的。简单来讲，发生在 L2 上的计算可通过称为“ witness 生成”的过程表示为二维矩阵。然后可以用多项式列表来表示矩阵 - 每列都可以编码为其自己的一维向量。然后，计算的有效性可以表示为这些多项式之间必须保持的一组数学关系。例如，如果前三列分别由多项式 a(x)、b(x) 以及 c(x) 表示，可能需要关系 a(x)⋅b(x)−c(x)=0 保持。多项式（代表计算）是否满足这些“正确性约束”可通过在一些随机点评估多项式来确定。如果“正确性约束”在这些随机点上得到了具体的满足，则一名验证者可以非常高的概率断言计算是正确的。

很自然地看到像 KZG 这样的多项式承诺方案，是如何直接插入到这个范式中的：rollup 将 commit to 一组多项式，它们一起代表计算。然后，验证者可要求对一些随机点进行评估，以检查正确性约束是否成立，从而验证多项式表示的计算是否有效。

最后感谢@Kurt-Pan的指导与建议

参考文章

Understanding KZG10 Polynomial Commitments (taoa.io)

Kate Commitments: A Primer - HackMD

Dankrad Feist’s kzg commitment post

https://blog.subspace.network/kzg-polynomial-commitments-cd64af8ec868

Understanding KZG10 Polynomial Commitments

Committing to lunch (taoa.io)

book:Proof,argument and zero knowledge

KZG原始论文

Lecture1:Introduction to Zero knowledge Interactive Proofs

NP

NP Proof:

NP-proofs 属于可高效验证的 proofs.其中要求

1.Witness 的长度应当是 statement x 的长度的多项式表示.

2.Verifier 时间是 x 长度的多项式函数表示

NP proofs 例子

上述例子都可以用一种通用的语言关系 L 来表示

更具体而言,上述都是 NP 问题:(简单来说,求解困难,但是验证高效的问题)

P NP NPC

P 问题：指能在多项式时间求解出的问题.如 2SAT,欧拉路径,PATH 问题

NP:Nondeterministic polynominal(非确定性多项式) 一个问题不能确定是否能够在多项式时间内找到一个解。但若给出一个解，能在多项式时间内证明这个解是否正确 .如果找到一个解，那么 NP 问题就变成了 P 问题，所以 P∈NP 类注：NP 问题不能理解为非 P 问题著名的 NP 类问题：旅行家推销问题(TSP)。即有一个推销员，要到 n 个城市推销商品，他要找出一个包含所有 n 个城市的环路，这个环路路径小于 a。如果单纯的用枚举法来列举的话会有(n-1)! 种，已经不是多项式时间的算法了，阶乘比多项式复杂。假设有人猜几次就猜中了一条小于长度 a 的路径，TSP 问题解决了。可是，人们不可能每次都猜的那么准。所以说，这是一个 NP 类问题。也就是，我们能在多项式的时间内验证并得出问题的正确解，可是我们却不知道（非不存在）该问题是否存在一个多项式时间的算法能解决 NP****问题的本质是单向性，不可快速求解，但是能够快速验证。

NPC：规约：问题 A 可以转化为问题 B，对于难度而言，问题 B 比问题 A 要困难。规约具有传递性：A 规约至 B，B 规约至 C，那么 A 规约至 C。一直规约下便会得到 NPC 问题所有的 NP 问题都可以约化成 NPC 问题。只要解决了这个问题，那么所有的 NP 问题都解决了。NPC 需要满足两个条件.1：是一个 NP 问题 2：所有的 NP 问题都可以约化到它。如 SAT 问题、HAMPATH 问题都属于 NPC 问题.

NP-hard 问题它满足 NPC 问题定义的第二条但不一定要满足第一条（就是说，NP-Hard 问题要比 NPC 问题的范围广，NP-Hard 问题没有限定属于 NP），即所有的 NP 问题都能约化到它，但是它不一定是一个 NP 问题

P NP NPC NP-hard 关系

NP Language 定义:

给定二元关系 $R : {0, 1}^{*} \times {0, 1}^{*} \to 0, 1$ ,记语言 L(R)为集合 ${x : \exists w s . t . R (x, w) = 1}$ .称一个语言 L(R) 是 NP 语言当如下两个条件成立:

|w|=poly(|x|)
给定任意的 x、w, 存在多项式时间算法能够高效判定 R(x, w) =? 1

注:此时还与零知识无关

考虑有没有其他方式,比如在大素数分解 N=PQ 中,不暴露 P 或 Q 的值让验证者相信这些类型的定理

ZKP

引入交互与随机

交互

验证者不再被动地阅读证明，相反验证者会与证明者进行重要的交互。

Prover 与 Verifier 之间进行多项式步骤的****交互

随机

Verifier 不再是一个确定性的算法

Verifier 的问题通过抛硬币的方式,即问题在某种程度上是不可预测的

随机性的本质是接受小概率的错误,但这种概率应当被量化,比如小于某一个可忽略函数.

例子

参考郭宇老师的初识「零知识」与「证明」—— 探索零知识证明系列（一):地图三染色问题

Definitions of Zeroknowledge interactive Proof

1.Interactive Proof system for a Language L

可忽略函数:一个比任何多项式函数分之一增长都慢的函数

Zero knowledge

谈论零知识前,需要引入模拟器的概念.

这里参考郭宇老师–从「模拟」理解零知识证明：平行宇宙与时光倒流—探索零知识证明系列（二）,而不使用课程的例子.

模拟器:Simulator

简单来说

**现实世界/视图:**是一个概率分布.这个空间中的点都是证明者和验证者之间交互的所有可能历史加上验证者的硬币投掷。

理想世界/视图:也是一个概率分布.但理想世界/视图需要是算法可构造的,由 Simulator 负责构造.

理想世界/视图与现实世界/视图的差异在于:理想世界/视图没有知识,现实世界/视图拥有知识.

对于一个多项式时间的区分器，它从上述分布中选择一个样本.如果区分器不能区分这个样本来自哪个分布,即来自哪个世界/视图,我们说这样的交互协议是零知识的.

因为理想世界/视图中的 Zlice 是没有任何知识，而且她和真实世界/视图中的 Alice 不可区分.

或者说区分成功的概率不大于 0.5.那么这两个分布在计算上是无法区分的。

Simulator 是怎么做到这一点的? Simulator 能够而是因为它可以“倒序“生成 视图/世界,即 Simulator 可以先随机选择一个挑战，然后基于这个挑战生成证明的一部分。这样生成的视图在统计上与真实的视图无法区分。

计算不可区分定义:

这里给出更一般的计算不可区分定义

这里的安全参数 k 表示某个计算困难问题的困难问题实例输入大小。每个困难问题都有一个界，当输入大小超过这个界时，我们就认为这个问题是计算困难的。–具体可参考刘巍然老师的回答

Zero Knowledge Define:

Flavor of Zero Knowledge

零知识分类

这里不给出形式化定义,简单来说即

两个随机变量的分布是计算不可区分的，也就是任何多项式时间的随机敌手都无法区分这两个分布，就称这个证明系统是计算零知识 (Computationally Zero-Knowledge)

两个随机变量的分布是统计不可区分的，也就是它们的统计距离 (Statistical Distance) 可忽略，就称这个证明系统是统计零知识 (Statistically Zero-Knowledge) 的；

如果统计距离就是 0，又叫做完美零知识 (Perfect Zero-Knowledge) 的；

Proof of Knowledge

一个 Proof System 是 POK 的,需满足以下定义

需要引入抽取器,抽取器具有时光回溯的能力.

抽取器在理想世界中，通过时间倒流的超能力，把 Prover 的知识完整地抽取出来

注:抽取器可以提取出 witness，不是因为它具有无限的计算能力,而是因为它能与证明者进行多次交互。在每一轮的交互中，抽取器都会选择一个新的挑战，然后记录下 Prover 的回应。

这就保证了一个没有知识的 Prover 是无法让抽取器达成目标，从而证明了可靠性。

抽取器只能从能成功完成证明的证明者那里提取出（witness）。如果一个 Prover 不能成功完成证明，那么他可能并不知道一个有效的 witness，因此抽取器无法从 Prover 那提取出 witness。

把这样一个依靠采用抽取器来证明可靠性的证明系统被称为 Proof of Knowledge

注:不是所有的可靠性都必须要求存在抽取器算法

这里可参考郭宇老师:探索零知识证明系列（三）:寻找知识

The First Application:Identity Theft

Alice 想通过互联网证明向 Bob 证明其就是 Alice,比如 Bob 是亚马逊的.

思想是:将证明 Alice 的身份转为 Alice 证明一道特定的难题,谁知道这个难题的答案谁就是 Alice.

NP and Zero Knowledge Interactive Proof

结论:如果单向函数(简单来说 is easy to compute on every input, but hard to invert given the image of a random input,具体参考 wiki)存在,那么每种 NP 语言都具有零知识交互证明。

先引入承诺的概念

承诺

承诺性质

Hiding:意味着敌手获得承诺 c(m)后无法获得 m 的值
- computational hiding:对于任意的 PPT 敌手 A.有
- Perfect hiding:将 A 的计算能力修改为无穷算力,“≤ negl(λ)”替换为 0
Binding:是指一个承诺 c(m) 在 Open 阶段打开只会为一个值 m 而不会得到 m‘.
- computational Binding
- perfect binding::将 A 的计算能力修改为无穷算力,“≤ negl(λ)”替换为 0

举例:地图三染色问题

地图的三染色问题是一个 NP 完全问题,即 NPC 问题.

生动易懂的例子仍然可以参考郭宇老师的初识「零知识」与「证明」—— 探索零知识证明系列（一):

过程总结如下:

性质如下

完整性:一个诚实的 P 总是可以说服验证者接受。因为无论 Vr 需要哪条边，P 总是可以正确地给出符合规则的上色方案。总是接受

**健全性:**无论恶意的 P *做什么，都会有一条边缘的颜色不正确。当 V 选择随机边时，实际上选中错误的概率是 1/E,成功骗过 P 的概率是(1-1/E).随着重复的次数增多,成功的概率变为 $(1 - 1/ E)^{k}$ ,呈指数级降低。概率接受

零知识性:很容易能够看出来,整个过程验证者得到了很多信息,但是这些信息并不会帮助验证者获取地图三染色问题答案的知识.但形式化证明很麻烦。

模拟器 不知道染色答案,它可以提前确定诚实 V 会询问的边 E‘ 模拟器 可以将整个图都涂成一样的颜色,除了 E’的两端 a,b 会被涂成两种不同的颜色. 对于模拟世界/视图:它会输出一堆承诺,由于承诺的性质,这些承诺不会给计算能力有限的 区分器 提供任何信息.然后 区分器 随机选择一条边 E,由于模拟器能够提前知道区分器随机选择哪条边.所以 E=E‘. 打开 E/E‘的承诺以后,V 会发现 a,b 是不同的颜色.模拟器 成功完成该轮挑战但实际上,模拟器 并不知道染色答案,但是 V 每次打开 E 的承诺,对应的 a,b 端点颜色又确实是不一样的.所以真实世界/视图与模拟世界/视图在计算上是无法区分的.

zk 的应用

法律隐私生物 DNA 甚至是核裁军

复杂性理论(Complexity Theory)

Interactive Proof

BPP:复杂类 BPP 在多项式时间内对概率图灵机解出的问题的集合, 并且对所有的输入，输出结果有错误的概率在 1/3 之内
IP:交互式证明
- 是一种包含了两个参与者（证明者和验证者）的验证系统，其中证明者试图通过多轮对话来说服验证者某个复杂陈述的真实性。
- 定义
  - 设⟨A, B⟩ 为一对交互式图灵机. 记 ⟨A(y), B(z)⟩(x) 为在 A、B 的随机输入带均匀独立选取, 公共输入为 x, A 的辅助输入为 y, B 的辅助输入为 z 时, 图灵机 B 与图灵机 A 交互后输出的随机变量.
  - 给定二元关系 R 及其对应语言 L(R), 则针对该语言的 IPS(interactive proof systems)是用符号⟨P(y),V(z)⟩表示 .其中,图灵机 P 与 P*可以是无穷算力 V 是 PPT 的.则 IPS 满足两个性质
    - 完备性 (completeness): 对于任意的 x ∈ L(R), 存在 y, 使得对于任意的 $z \in {0, 1}^{*}, P r [⟨ P (y), V (z)⟩ (x) = 1] \geq 1 - n e g l (∣ x ∣)$ . 完美完备性 (perfect completeness) 是指上述概率等于 1.
    - 可靠性 (soundness): 对于任意的 x ∈/ L(R), 任意的恶意证明者 P*, 任意的 $y, z \in {0, 1}^{*}, 有 P r [⟨ P^{*} (y), V (z)⟩ (x) = 1] \leq n e g l (∣ x ∣)$ .
IP 与 NP 的关系
- IP 类可以看作是经典复杂类 NP 的交互式****随机变体,所有的 NP 问题也都可以在 IP 中找到解决方案，因此 IP 是 NP 的超集。
- 在 IP 系统中，Prover 和 Verifier 之间有多轮的交互，而在 NP 问题中，证明（或解决方案）一旦生成，就可以独立地被验证，不需要进一步的交互。如果不允许交互，但允许验证者抛掷随机硬币并以小概率接受错误的证明，那么得到的复杂性类被称为 Merlin-Arthur(MA)
这再次说明了 IP 强大的关键在于随机性和交互的结合
- Prover 在 IP 中并没有时间复杂度的限制，可以是全知的，这意味着它可能运行在超出概率多项式时间的时间复杂度。它能够进行任意复杂的计算来构建它的证明，只要这个证明能够在多项式时间内被验证
- Verifier 在 IP 中必须运行在概率多项式时间（probabilistic polynomial time）内，即必须在多项式时间内完成计算

Private Coins Model

Interactive Proofs with Public Coins Model

“We can formulate a decision problem under uncertainty as a new sort of game, in which one opponent is ‘disinterested’ and plays at random, while the other tries to pick a strategy which maximizes the probability of winning – a ‘game against Nature’.” —Christos Papadimitriou. Games Against Nature. FOCS 1983.

如果不允许交互，但允许验证者抛掷随机硬币并以小概率接受错误的证明，那么得到的复杂性类被称为 Merlin-Arthur(MA)

AM 与 MA

Arthur-Merlin Protocol

协议中的两个参与者分别称为 Arthur 和 Merlin，基本假设是 Arthur 是配备随机数生成设备的标准计算机（或验证器），而 Merlin 实际上是具有无限计算能力的预言机（也称为证明者）。不过，Merlin 不一定是诚实的，所以亚瑟必须分析 Merlin 在回答亚瑟的询问时提供的信息，并自行决定问题。如果在这个协议中，每当答案是“是”时，Merlin 有一系列的回应，会导致 Arthur 在至少 2/3 的情况下接受，那么问题被认为是可以通过这个协议解决的。而如果答案是“否”，那么 Arthur 永远不会在超过 1/3 的情况下接受。

1-message protocol

Merlin 向 Arthur 发送消息，然后 Arthur 通过运行概率多项式时间计算来决定是否接受。（这类似于基于验证器的 NP 定义，唯一的区别是 Arthur 在这里被允许使用随机性。Merlin 在这个协议中无法访问 Arthur 的硬币抛掷，因为它是一个单消息协议，Arthur 只有在收到 Merlin 的信息后才会抛硬币。

从形式上讲如果存在多项式时间确定性图灵机 M 和多项式 p，q 使得对于长度 n = |x| 的每个输入字符串 x，

复杂度类 AM（或 AM[2]或 AM[K]）可以通过具有两条/K 条消息的 Arthur-Merlin 协议在多项式时间内决定。只有 1/2/K 个查询/响应对：Arthur 随机抛出一些硬币并将他所有抛硬币的结果发送给 Merlin，Merlin 用所谓的证明做出回应，Arthur 确定性地验证证明。

在这个协议中，Arthur 只被允许将抛硬币的结果发送给 Merlin，在最后阶段，Arthur 必须只使用他之前生成的随机抛硬币和 Merlin 的信息来决定是接受还是拒绝

从形式上讲如果存在多项式时间确定性图灵机 M 和多项式 p，q 使得对于长度 n = |x| 的每个输入字符串 x

简单总结:

摘自啊咪咪小熊— MA 就是最简单的 M 给 A 发完就结束了，A 自己决定是否接受，就是非交互式的（和 NP 的区别就是 Verifier 可以用随机数）。 AM 就是 A 先给 M 发一个随机数，然后 M 再给 A 回复，然后 A 再决定是否接受，就是交互式的

IP = PSPACE 定理

任何可以在多项式空间内解决的问题都可以通过交互式证明的方式来解决。

具体可参照这,这个假设的重要性在于它将两个看似不同的计算模型联系在了一起.

其中 PSPACE 简单理解为是比 NP 要大得多的语言类

MIP

MIP 类似于 IP，只是有多个证明者，并且假设这些证明者不会相互共享关于他们从验证者那里收到什么挑战的信息。MIP 的一个比喻是在审讯犯罪嫌疑人之前将多个犯罪嫌疑人放在不同的房间里，看看他们是否能保持他们的故事直截了当。对 MIP 的研究表明，如果一个人将证明者锁在不同的房间里，然后分别审问他们，他们可以说服审问者做出比一起接受审问要复杂得多的陈述。

Non Interactive Proof

通过 Fiat-Shamir 转换将 Interactive Proof 变为 Non-Interactive Proof

注:

Lecture2:Introduction to Modern SNARKs

Overview about zk-SNARK

Why commercial so much

历史可追溯至 1991 年的一篇论文[Babai-Fortnow-Levin-Szegedy’91]

Zk-snark application

blockchian
- 外包计算：
  - 扩容(zkRollup)：离线服务处理交易批次，L1 链验证一个简短的证明来证明该批次内的交易都是有效的,而无需分别验证每笔交易
  - 区块链桥接（zkBridge）：将资产从源链转移到目标链.源链的共识协议同意锁定某些资产，以便在另一个链中使用。通过验证 zksnark 生成关于源链到目标链的共识状态的简短证明,而无需验证源链共识的整个过程. 在上述两个例子中,非交互式证明非常重要。因为证明需要由大量区块链验证者进行验证
- 隐私性:需要零知识性
  - 公共区块链上的隐私交易：ZKP 在不泄漏交易信息的情况下证明一个私人交易是有效的。例子：TornadoCash、ZCash、Ironfish、Aleo。
  - 合规性：证明一个私人交易符合银行法规（例如 Espresso）证明一个交易所具有偿付能力而无需泄漏拥有资产情况（例如 Raposa）。
Non-blockchain:打击虚假信息, [Kang-Hashimoto-Stoica-Sun’22]

当阅读报纸文章时,文章通常会插有图片,但图片可能与文章内容完全无关甚至带有误导性质.

解决方案是 C2PA 标准,其代表内容来源和真实性,目标是为报纸文章中的图像提供真实的出处。

工作原理:在每台相机中嵌入一个由制造商嵌入的密钥。该密钥无法从相机中提取出

每次符合 C2PA 标准的相机拍摄照片时，会对照片以及与该照片关联的所有元数据进行签名,比如拍摄照片的位置和时间戳,然后嵌入到相机生成的原始图像数据中.

当图像嵌入文章并发送给读者时，读者可以简单地验证图像上的签名，并向读者显示元数据、位置和时间戳.

但 C2PA 标准有一个后处理的问题,即这些相机可捕捉非常高分辨率的图像。

但是为避免将图像发送给最终用户时浪费太多带宽,发送时会对图像采样.这意味着图像可能被重新调整为更低的分辨率，会被裁剪，会进行灰度化处理等.当将经过处理的照片发送到笔记本电脑时，笔记本电脑无法再验证图像上的 C2PA 签名。即必须拥有原始图像数据，否则无法验证签名。

所以问题就是：签名存在，但读者没有获得原始图像数据，因此无法验证签名是否有效。

采用 zk-snark 解决,思想:在图片被编辑前,为该图片生成一个 zk-snark proof.

Operation 表示应用于该照片的操作列表:例如缩小尺寸、灰度化、裁剪

读者验证 zk-SNARK 证明,如果有效则将向用户显示元数据.

Define zksnark

首先介绍电路部分

Arithmetic Circuits

Fix a finite field F={0,1,…,p-1} for some prime p>2

Arithmetic Circuits 是一个函数，它接受有限域中元素作为输入并产生有限域中的元素作为输出。

它由若干域上的加法门和乘法门组成. 电路的大小=电路中门的数量,如上图 |C|=3.

电路可满足问题 (circuit satisfiability problem, C-SAT) 是指给定电路 C、电路的部分输入 x (x 可为空) 和电路输出 y, 判断是否存在证据 w (电路的另一部分输入, 视为秘密输入) 使得 C(x, w) = y.

布尔电路(Boolean circuit)是算术电路的子类, 其仅有与门、异或门等布尔逻辑门, 变量取值仅为 0 或 1. 可以证明, 通过增加常数级别的电路门和深度, 任何布尔电路都可以转换为算术电路

Valiant’s theorem:所有多项式时间可计算的函数都可以通过多项式大小的算术电路来表示

仅使用加法、乘法和减法，就可以实现 SHA256 函数，大约需要 20,000 个门才能完成，

Structured vs. unstructured circuits

非结构化电路:电路中有一堆门，而电线只是按照开发人员想要的方式去连接门

结构化电路:电路本身实际上是分层构建的，其中有一个固定的算术电路 M。

          输入从底部进入，重复应用M，最后计算输出。

M 有时被称为虚拟机

NARK: Non-interactive ARgument of Knowledge

NARK 代表非交互式知识论证,其应用于算数电路

电路的输入:公共 statement x 与秘密 w; 输出仍是 F 中的元素

NARK 会经过一个 Setup 阶段即预处理,Setup 将电路的描述作为输入,产生一些公共参数作为输出.

其中一部分参数与 Prover 相关,称为 PP.另外一些参数与 Verifier 相关,称为 VP.

Prover 通过 PP,x,w 作为输入,产生一个 proof .表明 C(x,w)=0.

Verifier 通过 PP,x 作为输入,对该 proof 进行验证.

整个过程 Prover 与 Verifier 并没有交互.

Define NARK Normallly

Properties of NARK

Knowledge soundness

Verifier 接受 w,表示 Prover know w.st C(x,w)=0 成立.如何理解 konw 呢,这就是第一节提到的提取器的概念

非正式来说,w 能够以某种方式从 Prover 中提取到 w,则表示 Prover know w.

正式定义则如上图.对于多项式时间对手 A 试图充当恶意证明者,在不知道 statement 对应的 w 情况下通过 Verifier 的验证,其中 A 分为两个算法,A0 与 A1.过程如下

生成全局参数 gp
将全局参数提供给第一个敌手算法 A0，敌手将生成一些内部状态 st,伪造证明的电路 C 和 statement x
生成 PP 与 VP
将 PP,C,x 作为输入运行算法 A1,A1 输出一个 proof

当将这个 proof 与 statement x 一起提供给 Verifier 时，验证者将以百万分之一的概率接受。如果这是真的，那么应该存在一种有效的提取算法 E 并且该提取器 E 将按如下方式工作。

生成全局参数 gp
将全局参数提供给第一个敌手算法 A0，敌手将生成一些内部状态 st,伪造证明的电路 C 和 statement x
E 会以某种方式与算法 A1(作为 Oracle)进行交互,然后提取出 w.

提取的 w 满足 C(x,w)=0，概率大约是百万分之一减去一些可以忽略不计的值等等。

总结:如果对手 A 能够说服 Verifier 它知道某些 C,statement 和对应的 w，

那么就有一个提取器可以与该对手 A 交互并实际上从 A 中提取 w，使得 C (x,w)= 0。

trivial NARK:即 proof $π = w$ 的情况.不满足零知识性,但满足前两个属性.Verifier 可以根据 proof 与 x 重新运行电路验证 C(x,w)=0 是否成立

SNARK:Succinct Non-interactive ARgument of Knowledge

succinct preprocessing NARK

SNARK 是算法 S、P、V 的三元组，与 NARK 中一样，只是对 proof 提出了额外的要求

证明者生成的证明必须很短，特别是其大小必须是 w 大小的次线性。

证明也应该能够快速验证，这意味着 Verifier 的运行时间应该与电路大小呈次线性关系。

因此，验证者不能简单地重新运行电路 C，但它必须与 x 呈线性关系，因为 Verifier 必须按顺序读取 x

所以 time(V)在 x 上是线性的，但在电路 C 的大小上必须是次线性的。

strongly succinct preprocessing NARK

实践中的 SNARK 实际上会非常简洁(strongly succinct)。

strongly succinct:意味着

proof 不仅是 w 大小的次线性，证明长度必须是电路大小的对数关系.使证明与电路相比非常小！
验证证明的时间与 x 的大小成线性,且最多是电路规模的对数关系。

意味着 Verifier 没有时间读取整个电路，也就是 Verifier 甚至不知道电路 C 是什么.也就无法验证一个语句

这就是为什么需要公共参数的原因，它为 Verifier 提供电路的 vp 摘要，以便在 log(∣C∣)内足以运行验证。

ZK-SNARK 就是零知识的 SNARK

像 NARK 一样,考虑一个 trival SNARK 的情况,如上图所示,发现 a trival SNARK 并不满足一个 SNARK 定义.

Preprocessing Setup

Setup 阶段读取整个电路 C,然后输出电路 C 的摘要-一些公共参数,包括 Prover 会用到的 PP 与 Verifier 会用到的 VP.

Setup 阶段通常会采用一些随机位 r 用于生成参数的过程，可分为以下几类

Trusted setup per circuit:每一个电路都需要重新执行一次 Setup 过程.随机数 r 非常重要,应当保证 Setup 阶段后 r 被销毁(可信),否则其将能够伪造 proof.
Trusted and universal setup:将 Setup 分为两个阶段
- $S_{ini t} (λ, r) - > g p$ :是个一次性的算法,产生全局参数 gp.该阶段完成后,r 就被销毁.所以 init 阶段需要是可信的,但该阶段可以用于很多电路.
- $S_{in d e x} (g p, C) - > (pp, v p)$ :是一个确定性算法,为证明者和验证者生成参数。任何人都可以运行该算法并验证参数是否正确生成。
Transparent setup:不需要任何秘密值，因此任何人都可以验证它是否正确运行，并且不需要运行可信设置.比如 STRAK 协议

Building an efficient SNAKR

一个通用的构建 SNARK 的范例,包含两步或者说两个组件.functional Commitment Scheme 与 Interactive oracle proof.

Commitment 方案是一个加密对象，这意味着它的安全性取决于某些密码学假设。

IOP 交互式预言机证明实际上是一个信息论对象,可以在没有任何底层假设的情况下无条件地证明 IOP 的安全性

Commitment 承诺

简单回顾

承诺性质

Hiding:意味着敌手获得承诺 c(m)后无法获得 m 的值
- computational hiding:对于任意的 PPT 敌手 A.有
- Perfect hiding:将 A 的计算能力修改为无穷算力,“≤ negl(λ)”替换为 0
Binding:是指一个承诺 c(m) 在 Open 阶段打开只会为一个值 m 而不会得到 m‘.
- computational Binding
- perfect binding::将 A 的计算能力修改为无穷算力,“≤ negl(λ)”替换为 0

有一个使用哈希函数的标准承诺构造。哈希函数 H:M×R→C，其中

commit(m,r)=H(m,r)
verify(m,com,r)=accept if com=H(m,r)

Commitment to a Function

选择一个函数族: F={f:X_→Y}. f 表示从集合 x 到集合 y 的函数
Prover 运行 Commit 算法,将函数 f 与随机数 r 作为输入, $co m_{f}$ 为输出.f 可以表示为一个电路 C，一个 C 程序等。

然后将 $co m_{f}$ 发送给 Verifier

Verifier 可以发送回一个函数域中的元素 x
Prover 将 x 对应的 f(x)=y,以及 proof 发送给 Verifier. Proof 表明 1.f(x)=y 2.f 属于 F

形式上讲， Function Commitment Scheme 由以下定义：

setup_( $1^{λ}$ )→gp 输出公共参数 gp 。
commit(gp,f,r)→ $co m_{f}$ 用随机数r∈R 承诺 f∈F
- 构建 SNARK,必须满足 Binding
- 对于 hiding, 构建 SNARK 并非必须满足, 但当构建 zk-SNARK 需要满足该属性
eval(P,V) :对于给定 $co m_{f}$ 和 x∈X,y∈Y ：
- Prover(gp,f,x,y,r)→π:生成一个简短的证明
- V(gp, $co m_{f}$ ,x,y,π)→accept or reject
- 事实上,Prover 与 Verifier 之间的 eval 算法是对以下关系的(zk)SNARK 证明: 1.f(x)=y 2. commit(pp,f,r)= $co m_{f}$ 3. f∈F

Examples of functional commitments

多项式承诺：承诺对象是单变量多项式, $f (X) \in F_{p}^{(\leq d)} [X]$ :表示所有次数最多为 d 的单变量多项式的集合。
多线性承诺：承诺为多线性多项式，其中 $F_{p}^{(\leq 1)} [X_{1}, \dots, X_{k}]$ :表示是 k 个变量的所有多线性多项式的集合，每个变量的次数最多为 1。
- 多线性多项式示例： $f (x 1, \dots, x 7) = x_{1} x_{3} + x_{1} x_{4} x_{5} + x_{7}$
向量承诺：承诺对象是一个向量, $u = (u 1, \dots, u d) \in F_{p}^{d}$ 。能够打开该向量中的任何特定单元格。在给定索引 i 的情况下,证明索引 i 处的该函数值 $f_{u} (i) = u_{i}$ .
- 向量承诺方案实例:默克尔树(Merkle tree)
内积承诺：承诺一个向量 $u \in F_{p}^{d}$ ,并定义一个函数 $f_{u}$ ,该函数接受另外一个向量 v 作为输入,并且输出两个向量的内积(u,v).

对于这 4 个承诺方案,可以从中任意一个基础上构建获得剩余承诺方案。

Polynomial Commitment Scheme

Prover 需要对多项式 $f \in F_{p}^{(\leq d)} [X]$ 承诺.Prover 试图说服 Verifier , $co m_{f}$ 满足

1.f(u)=v ,其中 u,v∈Fp 且公开可见
f 的 degree≤d.

我们希望证明是一个 SNARK，那么证明大小和验证时间应该是 $O (l o g_{d})$ ,下面是一些 PCS 的实现机制

Using bilinear groups: KZG’10 (trusted setup,也是实际中使用最多的), Dory’20 (transparent,相比 kzg 慢)
仅使用哈希函数：基于 FRI（long eval proofs）
仅使用常规的椭圆曲线,不需要额外的结构: Bulletproofs (short proof, but verifier time is O(d))
Using groups of unknown order: Dark’20(慢,未获得太多关注)

考虑 travial 的 PCS 情况,用系数表示的方式表示多项式 f, $f (x) = \sum_{0}^{d} a_{i} x^{i}$ ,过程如下

commit(f,r)= $H ((a_{0}, a_{1}, \dots, a_{d}), r)$
eval_ 将按如下方式完成：
- Prover 将 π = $((a_{0}, a_{1}, \dots, a_{d}), r)$ 发送给 Verifier
- verifier 从系数重构 f ，并检查是否 f(u)=v 和 $H ((a_{0}, a_{1}, \dots, a_{d}), r) = co m_{f}$ .

很明显这不符合 SNARK 的要求,因为证明大小和验证时间与 d 是线性关系的,而不是 O(log d)

Polynomial is Zero

这是 SNARK 的重要组成部分，也是使 SNARK 成为可能的重要原因

考虑最多为_d_ 次的非零多项式 $f \in F_{p}^{(\leq d)} [X]$

$r \leftarrow F_{p}, P r [f (r) = 0] \leq \frac{d}{p}$ :从有限域选择一个随机元素 r ,f(r)=0 的概率为 d/p

这是因为 f 最多有 d 个根,r 是从大小 p 的域 中随机选择的.r 命中 d 个根的概率为 d/p.

考虑当 p 远远大于 d 的情况下,比如 $p \approx 2^{256} 和 d \leq 2^{40}$ , d/p 可以忽略不计.这意味着当 $f (r) = 0 ， r \leftarrow Fp$ ,Verifier 有着非常高的概率相信多项式在所有点上都为 0.

判断一个多项式是否为 0,只需一个随机点进行评估,并检查评估值是否为零即可。

对应[Schwartz-Zippel-DeMillo-Lipton]定理.该定理也适用于多元多项式,将 d 理解为 f 的总 degree 之合即可.比如 $f = x^{2} + y^{3}, d = 5$

Two Polynomials are equation

设 $f, g \in F_{p}^{(\leq d)} [X], r \leftarrow Fp$ 如果 $f (r) = g (r) . 则 f (r) - g (r) = 0. 则 f - g = 0$ ,那么 f=g 的概率非常高.

下面给出判断两个多项式是否相等的交互式协议

V 从 Fp 中随机选择一个随机数 r,将 r 发送给 P
P 根据发来的 r,分别计算 f(r)与 g(r)的值为 y 与 y‘.将 y 与 y’以及对应的 proof 给 V
V 首先检查 proof 是否有效,然后检查 y 是否等于 y‘

通过承诺与 F-S 转换,将上述协议转为 SNARK 方案.

上图是一个 SNARK 方案,当
- d/p 可忽略
- 哈希函数 H 作为一个 Oracle,即 H 可自行获得随机质询，然后计算对对应的响应，并将响应发送给 P
该 SNARK 中,Statement x 是 f 与 g 对应的承诺 $co m_{f}, co m_{g}$ ;witness w 是 f 与 g 本身.
F-S 转化为非交互式 SNARK:P 通过 H(x)获得随机数 r,不再需要 V 发送 r.因为 V 同样能拿着 x 询问 Oracle,获得 r.
但这不是一个 zk-snark,因为 V 可以学习到多项式 f,g 在 r 处的值 y 与 y‘.

Inner product argument

证明者通过内积论证可利用循环****递归的方式证明他拥有两个公开向量承诺的消息, 且这两个消息的内积等于某个公开值. 对于长度为 n 的消息向量, 内积论证的通信复杂度为 O(log n).

Prover 可向 Verifier 证明对于公共输入 $A, B \in G, g, h \in G^{n}$ 和公开标量 z∈Zq

P 拥有向量 a、b,满足 $A = g^{a} 、 B = h^{b} 和 a \cdot b = z$ 则 statement 为

$(g, h, A, B, z; a, b) : A = g^{a} \land B = h^{b} \land a \cdot b = z$ ,其中向量 a,b 为 witness,g,h,A,B 为公共输入

内积论证的核心思想是将针对 n 长向量的 statement 根据 V 的随机挑战 c 归约为对 n/2 长向量的等价 statement,

在向量不断缩减至为标量后, P 只需要直接发送标量即可.

约定一些符号

1.固定群的生成元 g 后, 记 $g^{r}$ 为 [r], 令 n ∈ N, 记 $(g^{r_{1}}, g^{r_{2}},\cdot\cdot\cdot, g^{r_{n}}) 为 [R]$ ,[S]同理
设 g, h 的生成方式为 $g \leftarrow [R]$ , $h \leftarrow [S]$
对于 n 为偶数的向量 $r = (r_{1}, r_{2},\cdot\cdot\cdot, r_{n})$ (不是偶数可填充), 记 $r_{\frac{1}{2}} = (r_{1}, r_{2},\cdot\cdot\cdot, r_{\frac{n}{2}}), r_{\frac{2}{2}} = (r_{\frac{n}{2} + 1}, r_{\frac{n}{2} + 2},\cdot\cdot\cdot, r_{n})$

过程如下

首先基于 V 的随机挑战 c 构造长度一半于原密钥长度的承诺密钥, 即 $[r^{'}] \leftarrow [c^{- 1} r_{\frac{1}{2}} + c^{- 2} r_{\frac{2}{2}}]$
为防止 P 利用新的承诺密钥 [r′] 作恶, P 需在挑战阶段之前发送部分承诺值 $A_{- 1} = [a_{\frac{1}{2}} \cdot r_{\frac{2}{2}}] 和 A_{1} = [a_{\frac{2}{2}} \cdot r_{\frac{1}{2}}]$ . 此时新证据为 $a' = c a_{\frac{1}{2}} + c^{2} a_{\frac{2}{2}}$
P 和 V 计算新承诺: $A^{'} \leftarrow [a^{'} \cdot r^{'}] = [c a_{\frac{1}{2}} + c^{2} a_{\frac{2}{2}} \cdot (c^{- 1} r_{\frac{1}{2}} + c^{- 2} r_{\frac{2}{2}}) = A A_{- 1}^{c^{- 1}} A_{1}^{c}$
对于承诺密钥 [s]、承诺 B 和秘密输入 b, 利用挑战 c 的逆 $c^{- 1}$ 构造对应的承诺密钥 [s′]、新证据 b′ 和承诺值 B′ ,即 $[s^{'}] \leftarrow [c s_{\frac{1}{2}} + c^{2} s_{\frac{2}{2}}], b^{'} \leftarrow c^{- 1} b_{\frac{1}{2}} + c^{- 2} b_{\frac{2}{2}}, B^{'} \leftarrow [b^{'} \cdot s^{'}] = B_{- 1}^{c} B B_{1}^{c^{- 1}}$
对于 z,P 需在挑战阶段前构造 $z_{- 1} \leftarrow a_{\frac{2}{2}} \cdot b_{\frac{1}{2}} 和 z_{1} \leftarrow a_{\frac{1}{2}} \cdot b_{\frac{2}{2}}$
更新后的 $z^{'} \leftarrow a^{'} \cdot b^{'} = z_{- 1} c + z + z_{1} c^{- 1}$
归约后的新陈述为 $([r^{'}], [s^{'}], A^{'}, B^{'}, z^{'}; a^{'}, b^{'}) : A^{'} = [a^{'} \cdot r^{'}] \land B^{'} = [b^{'} \cdot s^{'}] \land a^{'} \cdot b^{'} = z^{'})$
…..递归规约

IOP:Interactive Oracle Proof

F -IOP 的目标是将 f∈F 的承诺转为通用电路的 SNARK。例如，对于一个多项式函数族 $F = F_{p}^{(\leq d)} [X]$ ，使用 F -IOP，可以将其转换为任何电路大小为 ∣C∣<d 的 SNARK。

Definition:C(x,w) 是某些算术电路。 $x \in F_{p}^{n}$ .F -IOP 是一个证明系统，用于证明 ∃w:C(x,w)=0 **

Setup: S(C)→(pp,vp),其中 $v p = (f_{0}, f_{- 1}, \dots, f_{- s})$ 是函数的 Oracle.即 vp 可以理解为 V 可查询的一堆 Oracle,V 可以要求某个给定值显示函数结果,过程如下

P 首先发送函数 f1 的 Oracle $f_{1}$ 。V 稍后可以在其选择的任何点对 f 进行评估.在实际中, $f_{1} = co mmi t (f_{1})$
V 从 Fp 中随机选择 r1 发送给 P.
重复 Step1 and Step2 t-1 轮
P 最后发送 ft 的 Oracle $f_{t}$ 。
V 开始验证,验证过程 V 可以访问 P 给出的所有 Oracle，以及所有生成的随机数 r 和公共输入 x

Properties of IOP

Completeness: $\exists w : C (x, w) = 0 ⟹ P r [V a cce pt s] = 1$
Knowledge Soundness:在没有 w 的情况下,恶意 P 无法让 V 相信他知道一个 w,使得 C(x,w)=0
- Extractor 可以访问 statement x 与函数 $f_{1}, f_{2} \dots f_{s}$ 本身,因为对于这些函数本身的承诺就是一个 SNARK,所以 Ectractor 可以从 $co m_{f}$ 中提取 f 本身,进而提取出 w.
Zeroknowledge :可不满足

Example of IOP

Polynomial IOP for claim $X \subseteq W \subseteq F_{p}$ ,用电路 C 去表示该关系: $C (X, W) = 0 ⟺ X \subseteq W \subseteq F_{p}$ ,过程如下

P 分别计算两个多项式 $f (Z) = \prod_{w \in W} (Z - w), g (Z) = \prod_{x \in X} (Z - x)$ ,V 也可计算 g(Z),因为 X 是公共的
P 计算一个商多项式 $q (Z) = f / g \in F_{p}^{(\leq d)} [X]$ ,只有在 g 包含所有 f 根的情况下,q 才是一个多项式,即X⊆W.举个例子

比如 X={1,2},W={1,2,4}, $f (Z) = (Z - 1) (Z - 2) (Z - 4), g (Z) = (Z - 1) (Z - 2), q (Z) = f / g = (Z - 4)$ ,只有X⊆W,q 才是一个有限域中的有效多项式

P 发送 $f, q$ 给 V
V 发送一个随机数 r 给 P,虽然 P 不会用到 r,但仍然发送,这表明 r 是一个公共值
V 查询 $f, q$ 在 r 点的值,记做 w 与 q‘.计算 g(r).验证 g(r)*q’=w 是否成立

当我们设计 IOP 时，我们所要做的就是设计 P 向 V 发送哪些 Oracle，然后 V 在哪里查询这些 Oracle。

实际中,可以通过多项式承诺方案来实例化 IOP，其中这些 Oracle 被来自 P 的承诺所取代，查询动作基本上通过将查询点发送给 P 来取代，P 进行评估并发回评估正确完成的证明。然后 V 可以决定是否接受或拒绝最终的证明。

IOP + 相应的 Polynomial 方案构造 SNARK

Snarks in Practice

ZK-learning lecture 12:ZK- EVM

Background and motivation

The diagram of Layer1 blockchain

区块链简单介绍:

区块链网络由许多节点组成，通常有大量的节点用于指定，它们通过 P2P 网络互连，所有节点保持与上图红框显示的相同状态.这是一个类似于共享账本的数据库，因此可以将余额或者一些程序代码放在这里.然后使用名为 Merkle tree 的数据结构将所有这些信息存储在列表中.从而得到一个状态路由.

然后对状态路由取摘要来代表所有的状态.每个节点都需要维护相同的数据库.此外节点还将运行称为 EVM 的相同软件进行一些计算并更新状态路由，

区块链也称为 world computer 这个词，因为任何人都可以使用它来运行任何接近去中心化的程序，而运行在区块链之上的程序称为智能合约，因此 evm 将从节点计算机加载 merkle 树叶子结点中的数据到 Storage 中重写这棵树并获得新的状态路由

发送交易:

用户发送交易至区块链中,交易会在 p2p 网络中传播,通过共识算法在每个时隙中选择一个提案，这个提案将把它收到的许多交易打包到一个块中，同时以交易作为输入运行 evm 并更新状态路由，然后出块.在看到这个块被提交后，网络中的其他节点将下载这个块并重新通过 EVM 执行该块内的交易，就状态路由达成共识.这样始终维护相同的数据库.

Layer1 特点:

优点

Secure:交易将由不同的节点执行多次 Decentralized

缺点

Expensive Slow

zk-rollup

ZK-rollup 是一种扩展解决方案，用于解决 EVM 的可扩展性问题.

ZK-rollup 不像 Layer1 广播所有交易，以及拥塞且昂贵的 P2P 网络,其有一个单独的 Layer2 网络层，可以更加中心化.

zk-Rollup 的基本思想是将大量交易聚合到一个 Rollup 块中，并为该链下的块生成 简洁,公开,可验证 的证明。然后 Layer 1 上的智能合约只需要验证证明并直接应用更新的状态，而无需重新执行那些交易。这可以帮助节省一个数量级的 gas 费用，以及提升一个数量级别的网络吞吐.因为验证证明比重新执行计算便宜得多。另一个节省来自数据压缩（即只保留最小的链上数据用于验证).

这样做与原来的安全性是**等效的.**背后的原理依赖于 zk.

编写困难

但是构造这样一个 Prover 是困难的,对于某些计算的证明，首先需要以电路形式编写所有程序逻辑，

也就是用加法乘法和类似的非常底层的方法断言.电路强调非常复杂的逻辑，包括 for Loop ,if else 和所有程序.语法非常复杂.此外 一个电路对应一个程序，这意味着对于不同的应用程序开发人员，需要实现自己的电路.电路也需要通过一个非常严格的安全测试审计，这需要很长的开发时间.

兼容 : 比如一个 Prover 无法同时包含来自 uniswap 与 optiswap 上的交易.

所以需要 zkevm.

zkevm 概念

zkEVM 是一种虚拟机，通过 zk 证明计算和现有以太坊基础设施兼容的方式执行智能合约交易。这使它们能够成为零知识汇总、第 2 层扩展解决方案的一部分，从而提高交易吞吐量，同时降低成本

如果第 2 层可以运行为以太坊环境创建的程序而无需修改底层智能合约逻辑，则该 Layer2 是 EVM 兼容的。这使得第 2 层与现有的以太坊智能合约模式、代币标准和工具兼容。与 EVM 兼容对于这些第 2 层的广泛采用非常重要，因为它使熟悉以太坊 Solidity 编程语言的开发人员能够使用他们习惯的的工具构建高度可扩展的应用程序。

但是 zkevm 很难编写,有以下几点原因

**第一，EVM 对椭圆曲线的支持有限。**目前，EVM 仅支持 BN254 配对。由于不直接支持循环椭圆曲线，因此很难进行递归证明。在此之下也很难使用其他专用协议。验证算法必须是 EVM 友好的。
**第二，EVM字节为 256 位。**EVM 在 256 位整数上运行（就像大多数正常 VM 在 32-64 位整数上运行），而 zk 证明“天生地”大多在素数上工作。在电路内部进行“不匹配的字段计算”需要范围证明，这将在每个 EVM 操作中增加约 100 个约束。这将使 EVM 电路大小扩大两个数量级。
**第三，EVM 有很多特殊的操作码。**EVM 与传统 VM 不同，它有许多特殊的操作码，例如 CALL。它也有与执行上下文和 gas 相关的错误类型。这给电路设计带来了新的挑战。
**第四，EVM 是基于堆栈的虚拟机。**SyncVM (zksync) 和 Cario (starkware) 的架构在基于寄存器的模型中定义了自己的中间表示(IR,Intermediate Representation)/代数中间表示(AIR, Algebraic Intermediate Representation)。他们构建了一个专门的编译器，将智能合约代码编译成一新的 zk 友好 IR。他们的方案是语言兼容而不是原生 EVM 兼容。基于堆栈的模型和直接支持原生链工具更难证明。
**第五，以太坊存储层带来巨大开销。**以太坊存储层高度依赖 Keccak 和巨大的 MPT，它们都不是 zk 友好的，并且需要巨大的证明开销。例如，Keccak 哈希比电路中的 Poseidon 哈希大 1000 倍。但是，如果将 Keccak 替换为另一个哈希算法，则会对现有的以太坊基础设施造成一些兼容性问题。
**第六，基于机器的证明需要巨大的开销。**即使能够妥善处理上述所有问题，仍然需要找到一种有效的方法将它们组合在一起以获得一个完整的 EVM 电路。正如我们上一节中所提到的，即使像 add 这样简单的操作码也需要整个 EVM 电路的开销

以下技术的发展使得 zkevm 得以落地

**多项式承诺的使用。**在过去的几年里，大多数简洁零知识证明协议都坚持使用 R1CS，将 PCP 查询编码在特定于应用程序的可信设置中。电路大小通常会爆炸，且不能进行许多自定义的优化，因为每个约束的项数需要为 2（双线性配对只允许指数中的一次乘法）。使用多项式承诺方案，可以通过通用设置甚至透明设置将约束提升到任何项数。这为后端的选择提供了极大的灵活性。
**查找表参数和自定义配置的出现。**另一个强大的优化来自查找表的使用。该优化首先在 Arya 中提出，然后 Plookup 中进一步升级。这可以为 zk 不友好的原语（即，AND、XOR 等按位运算）节省很多成本。自定义配置可以高效地进行高项数的约束。TurboPlonk 和 UltraPlonk 定义了优雅的程序语法，以便更轻松地使用查找表和定制配置。这对于减少 EVM 电路的开销非常有帮助。
**递归****证明越来越可行。**递归证明在过去需要巨大的开销，因为它依赖于特殊的配对友好的循环椭圆曲线,这引入了很大的计算开销。然而，更多的技术在不牺牲效率的情况下使这成为可能。例如，Halo 可以避免对配对友好曲线的需要，并使用特殊的内积参数来摊销递归成本。Aztec 表明可以直接对现有协议进行证明聚合（查找表可以减少非原生字段操作的开销，从而可以使验证电路更小）。它可以极大地提高支持的电路大小的可扩展性。
硬件加速使证明更加高效。Scroll 为证明者制造了最快的 GPU 和 ASIC/FPGA 加速器。关于 ASIC 证明者的论文，今年已经被最大的计算机会议（ISCA）收录。GPU 证明器比 Filecoin 的实现快大约 5 到 10 倍。这可以大大提高证明者的计算效率。

ZKEVM 分类

Language level:采用高级语言（例如 Solidity 或 Vyper）编写的代码，并将其编译为旨在支持零知识证明的语言。本质上，它们相当于高级语言，但不是实际的 EVM。尽管合约可能不具有相同的地址，但这可以更快地生成证明并降低成本 Starknet
Bytecode level:牺牲了一些 EVM 功能，以实现更轻松的应用程序开发和证明生成，例如对预编译、VM 内存、堆栈以及智能合约代码处理方式的更改。虽然大多数以太坊应用程序都可以在这种环境中运行，但有些应用程序可能需要重写 Scroll Polygen
Consensus level:不会改变当前以太坊系统的任何部分，从而更容易生成零知识证明。这使得它们与所有以太坊本机应用程序完全兼容，并允许重复使用区块浏览器和执行客户端等工具。然而，以太坊协议的某些部分需要大量计算来生成零知识证明，导致 zkEVM 的证明时间较长

也可以参考 V 神的 4 种分类

Build a zkEVM from scratch

Interesting research problems

Other applications using zkEV

Lecture 16: Hardware Acceleration of ZKP

1.Goals of HW Acceleration

吞吐量，即每单位时间执行尽可能多的操作
成本
- 当优化成本时，目标是降低执行某些操作所涉及的资本和运营费用。对于比特币挖掘机来说，这意味着最大化每美元购买价值的哈希数量，同时最小化每个哈希的能源消耗，从而降低运营成本。
延迟：减少完成单个操作的时间
- 在高频交易等领域，延迟是一个重要的考虑因素。低延迟的证明生成可以促进更好的用户体验或更快的确定用例，比如ZK Bridges。

2.What needs accelerated

首先要注意的是每个证明系统及其相关实现都是利用不同的密码原语和不同的软件库构建的，在某一个证明系统中计算成本最高的部分，在另外不同的证明系统实现或用例中可能相对次要或可能根本不会出现，

其次不同的证明系统中，存在三种计算量大的操作，包括MSM，NTT，算术哈希。

3.MSM：多标量乘法

MSM 是一种用于计算多个标量乘法之和的算法，或者它可以被认为是椭圆曲线点和标量的点积。

由于问题的性质，每个标量乘法或一组标量乘法都可以很容易地并行化，并且可以由不同的硬件引擎拆分和操作然后汇集并在最后累积，有许多优化可用于减少计算 MSM 的计算量，用于更大尺寸的 MSM 算法，如pipepenger。

pippengers，将计算成本从线性减少到O(n/logn)，除了使用改进的算法之外，还有替代的点表示方法（Jacobian）和曲线表示方法（Edwards)可用于减少每个曲线上的域元素的操作总数

通过将它们从像 CPU 这样的主机设备转移到更并行的架构，如 GPU，可以提高计算效率。然而，当将操作从主机设备移动到外围设备时，必须记住一件事情，即数据也必须被移动以进行计算。在多标量乘法的情况下，标量和点必须从主机移动到加速器上进行计算。这两个设备之间可用的通信带宽通常会限制加速器的最大性能。

4.NTT

NTT 是一种用于将两个多项式相乘的算法 NTT 类似于其他算法，例如 fft 或 DFT，但它的独特之处在于它对有限域元素进行运算。

实现 NTT 的常用算法之一是Cooley-Tukey算法，该算法将多项式乘法的复杂性从O（n^2）降低到O（nlog n）阶

类似于 MSM 在主机设备上执行 NTT 时，标量也必须再次移至加速器通信带宽将限制加速器的最大可能性能，但是 NTT不容易并行化。每个元素必须在算法操作期间与各种其他元素交互，这意味着问题不能轻易进一步划分，因为这些元素与每个元素交互，它们必须保存在内存中并在强加高内存要求的情况下运行

5.算术hash

许多零知识证明用例中的算术哈希它要求

证明哈希原像的知识或利用哈希，Merkle roots和 Merkel 包含路径有效地表示电路外部的数据。算术哈希函数（如 Poseidon，rescue Prime）通常用于传统散列函数（如 ShA系列哈希函数）。

选择这些哈希函数是因为虽然本身它们的计算成本更高，但在电路内部使用时，部署效率会更高，因为这些哈希函数的constraints数量会更少。在实例化哈希函数时可以选择许多算法参数，这可能会影响计算成本。其中一些参数包括有限域大小，有限域选择的素数大小，MDS 矩阵结构等。

算术哈希原语的有效实现主要由模乘法驱动，证明生成中涉及的计算量大的操作通常因系统而异。

这些操作取决于承诺方案，像KZG这样的承诺方案会导致在生成证明过程中 MSM 操作会主导。

而当使用FRI承诺方案时，证明生成过程通常由 NTT 主导。

许多 snark 系统，例如groth16 和 Marlin由 MSM 主导，而 Starks 总体上通常由 NTT 主导。

但是这三个先前讨论的密码原语（MSM，NTT，算术哈希）在加速之前在所有证明系统中占据了三分之二或更多的时间这三个操作可能看起来截然不同，但它们实际上共享一些基础组件。

比如MSM and NTT的公共基础组件是域和曲线操作，这些操作的核心主要由域上的算术驱动，特别是模乘法

因此虽然这些算法的结构彼此，大不相同，但它们是基础的性能通常源自硬件执行模乘法的能力

需要注意的一件有趣的事情是数据大小与模乘法计算成本之间的关系，当数据大小呈线性增长,模乘法的计算成本相对于域的大小是N^2。

这意味着随着域大小的增长，加速器性能可能取决于操作的计算成本，但对于较小的域大小，加速器可能会受到主机可用带宽的瓶颈

这种二分法凸显了在开始设计硬件加速系统时理解证明系统的具体参数的重要性。

它也凸显了设计能够服务于各种证明系统和参数的硬件加速设备或实现的难度。

6.提高证明生成性能

改善证明生成性能的第一步是了解所使用的证明系统和用例的计算、内存和带宽成本，通过将高级操作（如 MSM 和 NTT）分解为计算它们所需的模乘数量。通常可以在完成实现之前估算证明系统在各种硬件平台上的性能。

然而，为了确保估计是准确的，有许多参数应该提前知道

第一个最重要的参数是证明系统中每个操作的数量，例如一些证明系统每个证明可能需要四个或更多 msms 而其他系统可能只需要两个

第二个关键因素是通常需要计算的操作的大小，不同的用例将导致每个操作的不同大小例如在某些用例中 MSM将只有 1000 的大小，而在另一个用例中，它可能是 1000 万或更多

第三个因素是确定的是域和曲线的大小，这将有助于告知每个模块化算术运算的带宽和计算复杂性

此外，点的表述形式（Affine or Jacobian），模运算等等 最后还有各种其他较小的因素可能有助于证明系统的性能一旦所有这些参数都确定了，执行证明或证明生成过程所需的模乘次数可以很容易地计算出来，有了这个数字，就可以与给定硬件平台的模型性能进行比较，以便在了解需要执行的计算的情况下得出性能估计或计算时间

硬件加速的下一步是为这些工作负载选择合适的硬件-主要由模乘法驱动

应该寻找可以快速且廉价地执行大量乘法的硬件平台

可通过查看平台上硬件乘法器以及每个乘法器可以执行的速度和频率来评估给定硬件平台的估计性能

上图是一个包含四个硬件平台的表格：桌面CPU、服务器 CPU、FPGA 和 GPU

第一个平台：桌面 CPU
- 包含八个内核，每个内核都有一个 64 x 64 位乘法器，工作频率为 5GHz
- 此平台的乘法功率估计约为164 该数字的计算方法是将乘法器的数量、乘法器大小和频率相乘，然后除以 1000
第二个平台：服务器 CPU
- 包含96 个内核，每个内核都有一个Multiplier，但以较低的频率运行，这个平台有大约 900 的Multi能力。是桌面处理器的五倍
第三个平台：FPGA
- 与服务器上存在的 96 个相比，超过 6000个乘法器。虽然乘法器数量大约是服务器CPU乘法器数量的 60 倍，但由于乘法器大小和频率的减少，乘法运算的功率小于服务器 CPU 的两倍。
第四个平台：GPU
- 大约5000个32*32位的乘法器，以 1.7 GHz 的频率运行，这产生了大约 9000乘法能力
- 相较于FPGA，拥有更大的乘法器大小和更高的工作频率，性能得到提高

关于这些底层硬件架构及其对模块性能的影响，强烈推荐Simon puffer 几年前在斯坦福区块链会议上的演讲，它可以在 YouTube 上找到

这些分析仅突出硬件平台的基础功能，

为了实现提高性能并达到硬件加速的目标，通常还必须考虑其他因素。

包括实现理论性能的能力、部署的便利性、运营成本、esa编程和许多其他因素

成功的硬件加速需要关注的两个关键领域

首先是选择适合目标平台的硬件友好算法

针对 GPU 和 FPGA 这样的目标平台具有数千个核心，最适合使用高度可并行化的算法。此外，在选择算法时，应选择旨在通过减少所需操作数量来降低总计算成本的算法。

一旦选择了算法，最后一步是创建高效的实现。通常情况下，需要重新构造算法以更好地匹配目标平台的硬件能力。除了重构算法外，通常还需要使用低级汇编原语来更充分地利用硬件资源并实现最大的性能。

7.硬件加速存在的限制与陷阱

在追求硬件加速时，乘法不是唯一需要的资源。虽然这些高级原语主要由模数乘法组成，但算术单元中的其他计算资源通常也是必需的。此外，根据正在加速的操作的大小和类型，非计算资源也可能成为瓶颈。例如，像 NTT 这样的操作有时会受到内存访问速度的瓶颈限制。

另外，对于问题规模较大的用例，有时所需数据无法全部在目标平台的内存中容纳，从而导致性能降低。对于连接到主机系统的加速器，通信带宽也可能成为瓶颈。目前，许多 GPU 和 FPGA 硬件加速的 NTT 实现受限于它们在主机和加速器之间传输数据的能力，而不是计算资源。有时可以通过将数据保留在加速器上来减少带宽需求，从而缓解或消除这些瓶颈。

数据移动成为瓶颈而不是数据计算不仅在 NTT 和 ZKP 系统中出现，而且在大数据和高性能计算环境中普遍存在这种趋势。对于高度并行的算法，计算速度往往比数据移动本身更快，因此硬件加速设计应尽量减少数据移动。

在使用主机外加速器时，另一个需要考虑的因素是将数据移动到加速器和返回主机的时间。

对于小问题，有时在主机上直接进行计算可能比在加速器上更高效。

硬件加速的最后一个陷阱是广为人知的奥姆德尔定律或贝尔定律，它指出，通过优化系统的单个部分或单个部分获得的总体性能提高取决于改进部分实际使用的时间占总时间的比例。

更简单地说，在 ZKP 系统中，如果 MSM、NTT 和算术哈希占据大约 65% 的时间，即使这些操作被消除，最大的加速比也只能达到 3 倍。考虑到证明生成与本地计算的时间开销相差几十万到一百万倍，显然优化工作不会止步于此。

8.FileCoin的加速例子

过去几年，Filecoin 一直是最大的 ZKP 系统之一，每天平均生成 1 到 5 百万个证明。

Filecoin 使用 ZKPS 来进行副本证明 (PRORAP)，这是一种证明你已经创建了数据集的唯一副本的加密方式。Filecoin 中使用的副本证明需要大约 470 GB 的 Poseidon 哈希。

如果在许多核心的 CPU 系统上进行哈希运算，需要大约 100 分钟。

相比之下，Filecoin 的 GPU 实现仅需要大约一分钟，可以实现大约 100 倍的性能提升。

对于 Filecoin 中的密码学证明组件，他们利用了 Groth16 协议。在 Filecoin 网络上进行每个 PoRep 时，存储提供者会生成 10 个证明，每个证明大约有 1.3 亿个约束条件，总共超过 10 亿个约束条件。仅用于创建这些证明的 MSM 就总计约为 45 亿个点标量对。

如果这些证明在许多核心的 CPU 上计算，需要约一个小时才能完成。相比之下，在 GPU 上可以在大约三分钟内完成，这是一个大约 20 倍的性能提升。这个例子突显了硬件加速让ZKP 用例变得实际可行的能力。

9.zk加速的现在与未来

了解更多关于硬件加速的知识，有许多在线资源可用，包括许多今天讨论的加密原语的开源 GPU 和 FPGA 实现。

一个特别好的资源是 zprize.io，这是一个旨在改善 ZKP 系统性能的社区倡议。

对用于更大的多标量乘法，单个 GPU 可以以每秒超过 1 亿个Bases的速度执行，就 NTT 而言，大小为 2 到28 的 NTT 可以在 250 毫秒内计算出来，对于 Poseidon 哈希，GPU 可以大约哈希每秒 350 GB。

尽管在过去几年中，ZKP 硬件加速取得了巨大进展，但仍有很大的改进空间。下面是一些可以帮助证明生成更快的领域。

第一个领域是针对核心原语（如 MSM 和 NTT）的改进算法或对现有算法的其他优化。

第二个领域是全新的核心原语，如具有更低计算要求的新哈希函数。

第三个领域即新的证明系统，特别是关于硬件加速的简化证明系统。简化的证明系统可以为硬件加速创造更多机会。

例如，更简化的证明系统可以减少不同操作、减少通信和内存要求，甚至消除一些目前存在的计算昂贵的操作。最后，改进实现的空间也永远存在，包括完整的证明系统和硬件加速的原语。这包括针对商用 GPU 和 FPGA 等现成硬件以及定制硅片（例如 ASIC）的设计。

Reference

Amber Group.“Need for Speed: Zero Knowledge.Introduction I by Amber Group

Feng, Boyuan. “Multi-scalar Multiplication (MSM) .

Figment Capital.“Accelerating Zero-Knowledge Proofs.

Jane Street. “Accelerating zk-SNARKs - MSM and NTT alorithms on FPGAs with Hardcaml.” Jane Street Tech Blog, 7 December 2022.

Thaler, Justin. “Measuring SNARK performance: Frontends, backends, and the future.” a16z crypto, 11 August 2022

Zhang, Ye. “ZKP MOOC Lecture 12: zkEVM Design, Optimization and Applications.

Thanks

感谢SecbitLabs @郭宇前两个月分享的Spartan Overview (尽管当时也没太理解)，以及@even 在研究方向上的指引(据说Hyrax 不太好啃)，不至于走太多弯路。

我的动机

缘于folding，缘于NOVA，缘于Setty，了解到了Spartan，但并不认识它，所以才有了本篇及接下来的关于它的一切(预备知识)……

关于Spartan，在ZK领域可能时间上相对也有点儿远了，暂且不考虑它在某些方面的争议，它的一些思想其实已经影响到其它比较热门的方向了，比如当下的热点Lasso & Jolt，所以它的研究意义仍然很大。

Overview

本篇文章主要参考Hyrax 论文前半部分1-4节，即优化前的GKR zk argument

GKR 协议本身是Sumcheck协议的一种应用，不带zk argument的GKR 就可以简单认为是多个sumcheck协议的叠加，带zk argument的GKR就会带来很多的细节问题，这也是Hyrax 的起源，所以弄清楚GKR with zk argument 的各个细节后自然也就清楚了Hyrax的意义

数据并行化下的GKR 协议

节选自PAZK 中的图

何为数据并行化GKR？就是同一个电路描述应用在多组input 数据中的GKR 协议，这样prover 在最开始的claims 中就不再是针对单一电路的output，比如下面的 $V_{0} = (0, 2)$ ：

而是多个子电路的output的汇总 $V_{0} = (0, 2, 3, 1)$ ：

在GKR协议中prover 要证明也不再是:

$V_{i - 1} (q) = h_{L} \in {0, 1}^{b_{G}} \sum h_{R} \in {0, 1}^{b_{G}} \sum a dd_{i} (q, h_{L}, h_{R}) (V_{i} (h_{L}) + V_{i} (h_{R})) + m u l_{i} (q, h_{L}, h_{R}) (V_{i} (h_{L}) \cdot V_{i} (h_{R}))$

而是：

$V_{i - 1} (q^{'}, q) P_{q^{'}, q, i} (h^{'}, h_{L}, h_{R}) = h^{'} \in {0, 1}^{b_{N}} \sum h_{L} \in {0, 1}^{b_{G}} \sum h_{R} \in {0, 1}^{b_{G}} \sum P_{q^{'}, q, i} (h^{'}, h_{L}, h_{R}) = e q (q^{'}, h^{'}) \cdot [a dd_{i} (q, h_{L}, h_{R}) (V_{i} (h^{'}, h_{L}) + V_{i} (h^{'}, h_{R})) + m u l_{i} (q, h_{L}, h_{R}) (V_{i} (h^{'}, h_{L}) * V_{i} (h^{'}, h_{R}))]$

另外需要备注一下各个notion的含义：

N 代表子电路的个数

G 代表单个子电路中每层Gate的个数

$V_{i - 1} (q^{'}, q)$ 代表第 $i - 1$ 层电路编码 $q^{'} \in F^{b_{N}}$ Gate编码 $q \in F^{b_{G}}$ 上的evaluation 值， $V_{i - 1} (q^{'}, q)$ 是 $V_{i - 1} (q^{'}, q)$ 的MLE

$V_{i} (h^{'}, h_{L})$ 代表第 $i$ 层电路编码 $h^{'} \in F^{b_{N}}$ Gate编码 $h_{L} \in F^{b_{G}}$ 上的evaluation 值， $V_{i} (h^{'}, h_{L})$ 是 $V_{i} (h^{'}, h_{L})$ 的MLE； $V_{i} (h^{'}, h_{R})$ 同理

$a dd_{i} (q, h_{L}, h_{R})$ 和 $m u l_{i} (q, h_{L}, h_{R})$ 分别代表 ${q, h_{L}, q_{R}} \in F^{b_{G}}$ 上的加法和乘法Gate的MLE，注意Gate的描述与电路的编码 $q^{'} \in F^{b_{N}}$ 无关，也跟input witness无关，所以它的计算可以在preprocessing 阶段就开始了，没有必要等到协议中才开始

$e q (q^{'}, h^{'})$ 代表电路编码 $q^{'} \in F^{b_{N}}$ 与电路编码 $h^{'} \in F^{b_{N}}$ 是否一致， $e q (q^{'}, h^{'})$ 是 $e q (q^{'}, h^{'})$ 的MLE

GKR Protocol with ZK Argument

仍然以为个图为例来扮演整个协议的过程。其中电路的个数 $N = 2$ ，所以 $b_{N} = 1$ ；有限域的moduler $p = 5$ 。

Step ZERO

假设前半部分为public input，后半部分为witness，对witness 的每个元素进行commit，并发送给verifier ：

$commit (2) 、 commit (3) 、 commit (2) 、 commit (4)$

Step ONE

prover 发送电路的output 作为Sumcheck的初始claims $V_{0} = (0, 2, 3, 1)$ ，verifier 根据给定的电路第0层的evaluation 值：

$b_{N} 0011 b_{G} 0101 V_{0} (b_{N}, b_{G}) 0231$

可以插值出相应的多项式：

$s_{0} (x_{1}, x_{2}) = 0 \cdot (1 - x_{1}) (1 - x_{2}) + 2 \cdot (1 - x_{1}) x_{2} + 3 \cdot x_{1} (1 - x_{2}) + 1 \cdot x_{1} x_{2}$

verifier 生成challenge factor $(q^{'}, q) = (2, 4) = (x_{1}, x_{2})$ ，并发送给prover，接下来进入第1层电路的 sumcheck 协议，prover 需要证明：

$V_{0} (q^{'}, q) = h^{'} \in {0, 1}^{b_{N}} \sum h_{L} \in {0, 1}^{b_{G}} \sum h_{R} \in {0, 1}^{b_{G}} \sum P_{q^{'}, q, 1} (h^{'}, h_{L}, h_{R}) = h^{'} \in {0, 1}^{b_{N}} \sum h_{L} \in {0, 1}^{b_{G}} \sum h_{R} \in {0, 1}^{b_{G}} \sum e q_{1} (q^{'}, h^{'}) \cdot [m u l_{1} (q, h_{L}, h_{R}) (V_{1} (h^{'}, h_{L}) * V_{1} (h^{'}, h_{R})) + a dd_{1} (q, h_{L}, h_{R}) (V_{1} (h^{'}, h_{L}) + V_{1} (h^{'}, h_{R}))] = ? s_{0} (2, 4) = 2$

Step TWO

将第1层的sumcheck 多项式拆解成多个item ：

$e q_{1} (q^{'}, h^{'}) m u l_{1} (q, h_{L}, h_{R}) a dd_{1} (q, h_{L}, h_{R}) V_{1} (h^{'}, h_{L}) V_{1} (h^{'}, h_{R}) = e q_{1} (2, y_{1}) = 2 y_{1} + (- 1) (1 - y_{1}) = 3 y_{1} - 1 = m u l_{1} (4, (y_{2}, y_{3}), (y_{4}, y_{5})) = 4 \cdot y_{2} (1 - y_{3}) \cdot y_{4} y_{5} = a dd_{1} (4, (y_{2}, y_{3}), (y_{4}, y_{5})) = (- 3) \cdot (1 - y_{2}) (1 - y_{3}) \cdot (1 - y_{4}) y_{5} = (1 - y_{1}) \cdot [(1 - y_{2}) (1 - y_{3}) + 4 (1 - y_{2}) y_{3} + 2 y_{2} (1 - y_{3}) + y_{2} y_{3}] + y_{1} \cdot [4 (1 - y_{2}) (1 - y_{3}) + 4 (1 - y_{2}) y_{3} + y_{2} (1 - y_{3}) + y_{2} y_{3}] = (1 - y_{1}) \cdot [(1 - y_{4}) (1 - y_{5}) + 4 (1 - y_{4}) y_{5} + 2 y_{4} (1 - y_{5}) + y_{4} y_{5}] + y_{1} \cdot [4 (1 - y_{4}) (1 - y_{5}) + 4 (1 - y_{4}) y_{5} + y_{4} (1 - y_{5}) + y_{4} y_{5}]$

合并item ：

$V_{0} (q^{'}, q)] = V_{0} (2, 4) = h^{'} \in {0, 1}^{b_{N}} \sum h_{L} \in {0, 1}^{b_{G}} \sum h_{R} \in {0, 1}^{b_{G}} \sum e q_{1} (2, h^{'}) \cdot [m u l_{1} (4, h_{L}, h_{R}) \cdot (V_{1} (h^{'}, h_{L}) * V_{1} (h^{'}, h_{R})) + a dd_{1} (4, h_{L}, h_{R}) \cdot (V_{1} (h^{'}, h_{L}) + V_{1} (h^{'}, h_{R}))] = y_{1} \in {0, 1} \sum y_{2} \in {0, 1} \sum y_{3} \in {0, 1} \sum y_{4} \in {0, 1} \sum y_{5} \in {0, 1} \sum (3 y_{1} - 1) * [(4 y_{2} (1 - y_{3}) y_{4} y_{5}) \cdot [((1 - y_{1}) \cdot ((1 - y_{2}) (1 - y_{3}) + 4 (1 - y_{2}) y_{3} + 2 y_{2} (1 - y_{3}) + y_{2} y_{3}) + y_{1} \cdot (4 (1 - y_{2}) (1 - y_{3}) + 4 (1 - y_{2}) y_{3} + y_{2} (1 - y_{3}) + y_{2} y_{3})) * ((1 - y_{1}) \cdot ((1 - y_{4}) (1 - y_{5}) + 4 (1 - y_{4}) y_{5} + 2 y_{4} (1 - y_{5}) + y_{4} y_{5}) + y_{1} \cdot (4 (1 - y_{4}) (1 - y_{5}) + 4 (1 - y_{4}) y_{5} + y_{4} (1 - y_{5}) + y_{4} y_{5}))] + ((- 3) (1 - y_{2}) (1 - y_{3}) (1 - y_{4}) y_{5}) \cdot [((1 - y_{1}) \cdot ((1 - y_{2}) (1 - y_{3}) + 4 (1 - y_{2}) y_{3} + 2 y_{2} (1 - y_{3}) + y_{2} y_{3}) + y_{1} \cdot (4 (1 - y_{2}) (1 - y_{3}) + 4 (1 - y_{2}) y_{3} + y_{2} (1 - y_{3}) + y_{2} y_{3})) + ((1 - y_{1}) \cdot ((1 - y_{4}) (1 - y_{5}) + 4 (1 - y_{4}) y_{5} + 2 y_{4} (1 - y_{5}) + y_{4} y_{5}) + y_{1} \cdot (4 (1 - y_{4}) (1 - y_{5}) + 4 (1 - y_{4}) y_{5} + y_{4} (1 - y_{5}) + y_{4} y_{5}))]$

Round one

prover 计算本次round 验证需要用到的proof，也就是单变量多项式 $s_{1} (y_{1})$ ：

$y_{2} y_{3} y_{4} y_{5} 00011011 f (y_{1}) (3 y_{1} - 1) \cdot (- 3) \cdot ((1 + 3 y_{1}) + 4) (3 y_{1} - 1) \cdot 4 \cdot (2 - y_{1})$

备注： $y_{2} y_{3} y_{4} y_{5}$ 其它编码取值对应的多项式为0，就没有一一枚举出来

则：

$s_{1} (y_{1}) = (3 y_{1} - 1) \cdot (- 3) \cdot ((1 + 3 y_{1}) + 4) + (3 y_{1} - 1) \cdot 4 \cdot (2 - y_{1}) = 2 + 2 y_{1} + y_{1}^{2} = c_{0, 1} + c_{1, 1} y_{1} + c_{2, 1} y_{1}^{2}$

prover 需要把多项式 $s_{1} (y_{1})$ 的commitment发送给verifier，也就是把该多项式的4个系数的commitment 之后发过去：

$δ_{c_{0, 1}} = commit (c_{0, 1}) = commit (2) δ_{c_{1, 1}} = commit (c_{1, 1}) = commit (2) δ_{c_{2, 1}} = commit (c_{2, 1}) = commit (1) δ_{c_{3, 1}} = commit (c_{3, 1}) = commit (0)$

verifier 需要验证：

$s_{1} (0) + s_{1} (1) = ? s_{0} (2, 4) = 2$

根据commitment 加法同态的性质，需要验证：

$2 δ_{c_{0, 1}} + δ_{c_{1, 1}} + δ_{c_{2, 1}} + δ_{c_{3, 1}} = ? commit (s_{0} (2, 4)) = commit (2) ✓$

验证通过，verfier 发送challenge factor $r_{1} = y_{1} = 3$ ，下一个round 需要验证的目标值为：

$s_{1} (3) = 2 + 6 + 9 = 17 mod 5 = 2$

Round two

基于 $y_{1} = 3$ ，prover 计算本次round 验证需要用到的proof，也就是单变量多项式 $s_{2} (y_{2})$ ：

$y_{3} y_{4} y_{5} 001011 f (y_{2}) 8 \cdot - 3 (1 - y_{2}) \cdot ((10 - 11 y_{2}) + 4) 8 \cdot 4 y_{2} \cdot ((10 - 11 y_{2}) * 1)$

备注： $y_{3} y_{4} y_{5}$ 其它编码取值对应的多项式为0，就没有一一枚举出来

则：

$s_{2} (y_{2}) = 8 \cdot - 3 (1 - y_{2}) \cdot ((10 - 11 y_{2}) + 4) + 8 \cdot 4 y_{2} \cdot ((10 - 11 y_{2}) * 1) = 4 + 4 y_{2}^{2} = c_{0, 2} + c_{2, 2} y_{2}^{2}$

prover 需要把多项式 $s_{2} (y_{2})$ 的commitment发送给verifier，也就是把该多项式的4个系数的commitment 之后发过去：

$δ_{c_{0, 2}} = commit (c_{0, 2}) = commit (4) δ_{c_{1, 2}} = commit (c_{1, 2}) = commit (0) δ_{c_{2, 2}} = commit (c_{2, 2}) = commit (4) δ_{c_{3, 2}} = commit (c_{3, 2}) = commit (0)$

verifier 需要验证：

$s_{2} (0) + s_{2} (1) = ? s_{1} (3) = 2$

根据commitment 加法同态的性质，需要验证：

$2 δ_{c_{0, 2}} + δ_{c_{1, 2}} + δ_{c_{2, 2}} + δ_{c_{3, 2}} = ? commit (s_{1} (3)) = commit (2) ✓$

验证通过，verfier 发送challenge factor $r_{2} = y_{2} = 4$ 给prover，下一个round 需要验证的目标值为:

$s_{2} (4) = 4 + 64 = 68 mod 5 = 3$

Round three

基于 $y_{1} = 3, y_{2} = 4$ ，prover 计算本次round 验证需要用到的proof，也就是单变量多项式 $s_{3} (y_{3})$ ：

$y_{4} y_{5} 0111 f (y_{3}) 8 \cdot 9 (1 - y_{3}) \cdot ((26 y_{3} - 34) + 4) 8 \cdot 16 (1 - y_{3}) \cdot ((26 y_{3} - 34) * 1)$

备注： $y_{4} y_{5}$ 其它编码取值对应的多项式为0，就没有一一枚举出来

则：

$s_{3} (y_{3}) = 8 \cdot 9 (1 - y_{3}) \cdot ((26 y_{3} - 34) + 4) + 8 \cdot 16 (1 - y_{3}) \cdot ((26 y_{3} - 34) * 1) = 3 + 2 y_{3} = c_{0, 3} + c_{1, 3} y_{3}$

prover 需要把多项式 $s_{3} (y_{3})$ 的commitment发送给verifier，也就是把该多项式的4个系数的commitment 之后发过去：

$δ_{c_{0, 3}} = commit (c_{0, 3}) = commit (3) δ_{c_{1, 3}} = commit (c_{1, 3}) = commit (2) δ_{c_{2, 3}} = commit (c_{2, 3}) = commit (0) δ_{c_{3, 3}} = commit (c_{3, 3}) = commit (0)$

verifier 需要验证：

$s_{3} (0) + s_{3} (1) = ? s_{2} (4) = 3$

根据commitment 加法同态的性质，需要验证：

$2 δ_{c_{0, 3}} + δ_{c_{1, 3}} + δ_{c_{2, 3}} + δ_{c_{3, 3}} = ? commit (s_{2} (4)) = commit (3) ✓$

验证通过，verfier 发送challenge factor $r_{3} = y_{3} = 2$ 给prover，下一个round 需要验证的目标值为:

$s_{3} (2) = 3 + 4 = 7 mod 5 = 2$

Round four

基于 $y_{1} = 3, y_{2} = 4, y_{3} = 2$ ，prover 计算本次round 验证需要用到的proof，也就是单变量多项式 $s_{4} (y_{4})$ ：

$y_{5} 1 f (y_{4}) 8 \cdot - 16 y_{4} \cdot (18 * (4 - 3 y_{4})) + 8 \cdot - 9 (1 - y_{4}) \cdot (18 + (4 - 3 y_{4}))$

备注： $y_{5}$ 其它编码取值对应的多项式为0，就没有一一枚举出来

则：

$s_{4} (y_{4}) = 8 \cdot - 16 y_{4} \cdot (18 * (4 - 3 y_{4})) + 8 \cdot - 9 (1 - y_{4}) \cdot (18 + (4 - 3 y_{4})) = 1 + 4 y_{4} + y_{4}^{2} = c_{0, 4} + c_{1, 4} y_{4} + c_{2, 4} y_{4}^{2}$

prover 需要把多项式 $s_{4} (y_{4})$ 的commitment发送给verifier，也就是把该多项式的4个系数的commitment 之后发过去：

$δ_{c_{0, 4}} = commit (c_{0, 4}) = commit (1) δ_{c_{1, 4}} = commit (c_{1, 4}) = commit (4) δ_{c_{2, 4}} = commit (c_{2, 4}) = commit (1) δ_{c_{3, 4}} = commit (c_{3, 4}) = commit (0)$

verifier 需要验证：

$s_{4} (0) + s_{4} (1) = ? s_{3} (2) = 2$

根据commitment 加法同态的性质，需要验证：

$2 δ_{c_{0, 4}} + δ_{c_{1, 4}} + δ_{c_{2, 4}} + δ_{c_{3, 4}} = ? commit (s_{3} (2)) = commit (2) ✓$

验证通过，verfier 发送challenge factor $r_{4} = y_{4} = 4$ 给prover，下一个round 需要验证的目标值为:

$s_{4} (4) = 1 + 16 + 16 = 33 mod 5 = 3$

Round five

基于 $y_{1} = 3, y_{2} = 4, y_{3} = 2, y_{4} = 4$ ，prover 计算本次round 验证需要用到的proof，也就是单变量多项式 $s_{5} (y_{5})$ ：

$- - f (y_{5}) 8 \cdot - 64 y_{5} \cdot (18 * (26 y_{5} - 34)) + 8 \cdot 27 y_{5} \cdot (18 + (26 y_{5} - 34))$

则：

$s_{5} (y_{5}) = 8 \cdot - 64 y_{5} \cdot (18 * (26 y_{5} - 34)) + 8 \cdot 27 y_{5} \cdot (18 + (26 y_{5} - 34)) = 3 y_{5} = c_{1, 5} y_{5}$

prover 需要把多项式 $s_{5} (y_{5})$ 的commitment发送给verifier，也就是把该多项式的4个系数的commitment 之后发过去：

$δ_{c_{0, 5}} = commit (c_{0, 5}) = commit (0) δ_{c_{1, 5}} = commit (c_{1, 5}) = commit (3) δ_{c_{2, 5}} = commit (c_{2, 5}) = commit (0) δ_{c_{3, 5}} = commit (c_{3, 5}) = commit (0)$

verifier 需要验证：

$s_{5} (0) + s_{5} (1) = ? s_{4} (4) = 3$

根据commitment 加法同态的性质，需要验证：

$2 δ_{c_{0, 5}} + δ_{c_{1, 5}} + δ_{c_{2, 5}} + δ_{c_{3, 5}} = ? commit (s_{4} (4)) = commit (3) ✓$

验证通过，verfier 发送challenge factor $r_{5} = y_{5} = 1$ 给prover，下一个round 需要验证的目标值为:

$s_{5} (1) = 3$

Last Round

目前challenge factor 的组合为：

$(3, (4, 2), (4, 1)) = (y_{1}, (y_{2}, y_{3}), (y_{4}, y_{5})) = (r^{'}, r_{L}, r_{R})$

prover 根据第1层电路的evaluation 值很容易就能插值出相应的MLE 多项式：

$V_{1} (x_{1}, x_{2}, x_{3}) = (1 - x_{1}) \cdot [(1 - x_{2}) (1 - x_{3}) + 4 (1 - x_{2}) x_{3} + 2 x_{2} (1 - x_{3}) + x_{2} x_{3}] + x_{1} \cdot [4 (1 - x_{2}) (1 - x_{3}) + 4 (1 - x_{2}) x_{3} + x_{2} (1 - x_{3}) + x_{2} x_{3}]$

prover 分别计算出三个claims 值的commitment：

$X Y Z = commit (V_{1} (r^{'}, r_{L})) = commit (V_{1} (3, (4, 2))) = commit (3) = commit (V_{1} (r^{'}, r_{R})) = commit (V_{1} (3, (4, 1))) = commit (2) = commit (V_{1} (r^{'}, r_{L}) \cdot V_{1} (r^{'}, r_{R})) = commit (3 * 2) = commit (1)$

verifier 拿着这三个commitment 完成第1层电路 sumcheck 协议的最后验证：

$e q_{1} (2, r^{'}) \cdot [m u l_{1} (4, h_{L}, h_{R}) \cdot commit (V_{1} (r^{'}, h_{L}) \cdot V_{1} (r^{'}, h_{R})) + a dd_{1} (4, h_{L}, h_{R}) \cdot (commit (V_{1} (r^{'}, h_{L})) + commit (V_{1} (r^{'}, h_{R})))] = 8 \cdot [- 64 * commit (1) + 27 * (commit (3) + commit (2))] = ? commit (s_{5} (1)) = commit (3) ✓$

mini-protocols

第一层电路evaluation 对应的MLE ：

$V_{1} (x_{1}, x_{2}, x_{3}) = (1 - x_{1}) \cdot [(1 - x_{2}) (1 - x_{3}) + 4 \cdot (1 - x_{2}) x_{3} + 2 \cdot x_{2} (1 - x_{3}) + x_{2} x_{3}] + x_{1} \cdot [4 \cdot (1 - x_{2}) (1 - x_{3}) + 4 \cdot (1 - x_{2}) x_{3} + x_{2} (1 - x_{3}) + x_{2} x_{3}]$

上一个sumcheck 协议的Last Round中prover 新增加了两个claims，也就是：

$V_{1} (r^{'}, r_{L}) = V_{1} (3, (4, 2)) = 3 V_{1} (r^{'}, r_{R}) = V_{1} (3, (4, 1)) = 2$

引入一个fold factor $t$ 我们可以把两个claims fold到一起：

$f_{H} (t) = V_{1} (r^{'}, (1 - t) \cdot r_{L} + t \cdot r_{R}) = V_{1} (3, (4, 2 - t)) = 18 - 26 t = 3 + 4 t$

它的非常重要的特性就是：

$f_{H} (0) = 3 = V_{1} (r^{'}, r_{L}) f_{H} (1) = 2 = V_{1} (r^{'}, r_{R})$

prover 把多项式 $f_{H} (t)$ 进行commit后发送给verifier，同样也是多个系数分别commit，该多项式degree 为2，也就是说最多有3个commitment：

$δ_{f_{0}} = commit (3) δ_{f_{1}} = commit (4) δ_{f_{2}} = commit (0)$

verifier 拿到多项式 $f_{H} (t)$ 的commitment 后就可以计算出：

$commit (f_{H} (0)) commit (f_{H} (1)) = δ_{f_{0}} = δ_{f_{0}} + δ_{f_{1}}$

这样就可以验证prover 之前发送的 $V_{1} (r^{'}, r_{L}) 、 V_{1} (r^{'}, r_{R})$ 的commitment 是否与当前多项式的commitment 是否一致：

$commit (V_{1} (r^{'}, r_{L})) commit (V_{1} (r^{'}, r_{R})) = commit (3) = ? commit (f_{H} (0)) = δ_{f_{0}} ✓ = commit (2) = ? commit (f_{H} (1)) = δ_{f_{0}} + δ_{f_{1}} ✓$

为了验证prover 之前发送的 $V_{1} (r^{'}, r_{L}) 、 V_{1} (r^{'}, r_{R})$ 的commitment X、Y是否合法，基于多项式 $f_{H} (t)$ 的commitment $δ_{f_{0}} 、 δ_{f_{1}} 、 δ_{f_{2}}$ ， verifier 随机采样一个challenge factor $v$ 并发送给prover，prover 自然可以计算出下一轮sumcheck协议需要证明的evaluation值 $f_{H} (v)$ ，即：

$V_{1} (q^{'}, q) = h^{'} \in {0, 1}^{b_{N}} \sum h_{L} \in {0, 1}^{b_{G}} \sum h_{R} \in {0, 1}^{b_{G}} \sum P_{q^{'}, q, 2} (h^{'}, h_{L}, h_{R}) = h^{'} \in {0, 1}^{b_{N}} \sum h_{L} \in {0, 1}^{b_{G}} \sum h_{R} \in {0, 1}^{b_{G}} \sum e q_{2} (q^{'}, h^{'}) \cdot [m u l_{1} (q, h_{L}, h_{R}) (V_{2} (h^{'}, h_{L}) * V_{2} (h^{'}, h_{R})) + a dd_{2} (q, h_{L}, h_{R}) (V_{1} (h^{'}, h_{L}) + V_{2} (h^{'}, h_{R}))] = ? f_{H} (v) = 3 + 4 v$

同时verifier 计算下一轮sumcheck协议需要证明的 $f_{H} (v)$ 的commitment：

$commit (f_{H} (v)) = δ_{f_{0}} + δ_{f_{1}} \cdot v + δ_{f_{2}} \cdot v^{2}$

最后我们再明确一点：mini-protocol 的根本目的是把两个claims fold成一个claims，减少prover 的成本，不然prover要分别证明两个claims：

$commit (V_{1} (3, (4, 2 - v))) = ? δ_{f_{0}} + δ_{f_{1}} \cdot v + δ_{f_{2}} \cdot v^{2} OR commit (V_{1} (3, (4, 2)) = ? commit (3) commit (V_{1} (3, (4, 1)) = ? commit (2)$

这样应该能make sense！

Step THREE

同Step TWO 一样，这里我们省略掉N 行文字+公式… 直接进入到Final Step！

Final Step

我们再回顾一下最开始的实例结构图：

根据最下面一层(public input + witness)的值，我们可以插值出MLE：

$V_{2} (x_{1}, x_{2}, x_{3}) = (1 - x_{1}) \cdot [(1 - x_{2}) (1 - x_{3}) + 2 \cdot (1 - x_{2}) x_{3} + x_{2} (1 - x_{3}) + 4 \cdot x_{2} x_{3}] + x_{1} \cdot [2 \cdot (1 - x_{2}) (1 - x_{3}) + 3 \cdot (1 - x_{2}) x_{3} + 2 \cdot x_{2} (1 - x_{3}) + 4 \cdot x_{2} x_{3}]$

Step THREE 的mini-protocol 同样也会归结到证明两个claims，为了方便描述我们假设 $(r^{'}, r_{L}, r_{R}) = (2, (3, 2), (3, 3))$ ：

$V_{2} (r^{'}, r_{L}) = ? V_{2} (2, (3, 2)) = 0 V_{2} (r^{'}, r_{R}) = ? V_{2} (2, (3, 3)) = 1$

多项式 $f_{H} (t)$ ：

$f_{H} (t) = t$

假设fold factor $v = 2$ ，把上面的两个claims合并成一个claim:

$V_{2} (2, (3, 4)) = ? f_{H} (v) = 2$

备注：简单一句话就是，证明最下面一层(public input+witness)电路、Gate编码为(2, (3, 4))， evaluation 值为2 ，组成的点在MLE 多项式上。

同样，verifier 基于prover 提供的 $f_{H} (t)$ 的commitment，计算出 $f_{H} (v)$ 的commitment:

$commit (f_{H} (2)) = δ_{f_{0}} + δ_{f_{1}} \cdot 2 + δ_{f_{2}} \cdot 2^{2} = commit (1) \cdot 2$

verifier 如何验证prover 提供的这个commitment的合法性？对于verifier 来说最下面一层电路的evaluation 分 public input p和 witness w，其中后者未知，假设两者长度相等，按照上图中的实例，也就是说前半部分为public input，后半部分为witness：

$(public input 1, 2, 1, 4, witness 2, 3, 2, 4)$

因此，我们需要把 $V_{2}$ 拆解成两部分

$V_{2} (x_{1}, x_{2}, x_{3}) = (1 - x_{1}) \cdot p (x_{2}, x_{3}) + x_{1} \cdot w (x_{2}, x_{3})$

最终是要计算出 $V_{2} (2, (3, 4))$ 的commitment，其中public input 部分因为是公开的，所以verifier 可以自行计算出相应的MLE 多项式 $p (x_{2}, x_{3})$ ，并拿到 $p (3, 4)$ 的commitment；另外witness 部分因为在Step ZERO prover 已经把它们的commitment 全部都已经发给verifier 了，verifier 只需要基于此拿到 $w (x_{2}, x_{3})$ 的commitment就可以了：

$w (x_{2}, x_{3}) commit (w (x_{2}, x_{3})) = 2 \cdot (1 - x_{2}) (1 - x_{3}) + 3 \cdot (1 - x_{2}) x_{3} + 2 \cdot x_{2} (1 - x_{3}) + 4 \cdot x_{2} x_{3} ⇓ = commit (2) \cdot (1 - x_{2}) (1 - x_{3}) + commit (3) \cdot (1 - x_{2}) x_{3} + commit (2) \cdot x_{2} (1 - x_{3}) + commit (4) \cdot x_{2} x_{3}$

最后的最后，我们put it together ：

$2 \cdot commit (1) = ? (1 - 2) \cdot commit (p (3, 4)) + 2 \cdot commit (w (3, 4)) = 4 \cdot commit (p (3, 4)) + 2 \cdot [commit (2) \cdot 1 + commit (3) \cdot 2 + commit (2) \cdot 1 + commit (4) \cdot 2]$

What’s Next

到此为止，满足ZK argument的Vallina 版本的GKR协议也就完整了，紧接着我们再detail一下Hyrax 在此基础之上都做了些什么？接着再看看Spark 在Hyrax基础之上做了些什么？最后再看看Spartan 的整个全貌？

参考资料

【1】Hyrax 论文：https://eprint.iacr.org/2017/1132.pdf

【2】PAZK by Thaler：https://people.cs.georgetown.edu/jthaler/ProofsArgsAndZK.pdf

【3】trivial GKR 协议：https://learnblockchain.cn/article/6199

【4】sumcheck 协议：https://learnblockchain.cn/article/6188

Thanks

感谢SecbitLabs @郭宇前两个月分享的Spartan Overview (尽管当时也没太理解)，以及@even 在研究方向上的指引(据说Hyrax 不太好啃)，不至于走太多弯路。

Motivation

缘于folding，缘于NOVA，缘于Setty，了解到了Spartan，但并不认识它，所以才有了本篇及接下来的关于它的一切(预备知识)……

Overview

本篇文章主要参考Hyrax 论文后半部分5-6节，即Hyrax 基于GKR with ZK Argument的contribution。

主要分为两部分，前半部分Reduced Sumcheck Verification主要针对GKR with ZK Argument的Step Two做的优化，对应Hyrax 论文中的Part 5。

后半部分Reduced Witness Evaluation 主要针对GKR with ZK Argument的Final Step做的优化，对应Hyrax 论文中的Part 6。

为了方便对照原始论文理解，本文中的notion尽量与Hyrax 原始论文对齐。

Reduced Sumcheck Verification

仍然以这个图为例， $N = 2$ ，则 $b_{N} = 1$ ；第0层， $G = 2$ ，则 $b_{G} = 1$ ；第1层， $G = 4$ ，则 $b_{G} = 2$ ；第2层， $G = 4$ ，则 $b_{G} = 2$ 。

Number of Sumcheck Commitments

为了简单起见，上一篇GKR with ZK Argument 中Sumcheck 协议每次round prover 发送给verifier 的多项式系数的commitment的个数我们固定都是4，也就是说多项式的degree全为3。其实prover 需要commit的多项式的degree是有变化的。

当round $i <= b_{N}$ 时，prover commit的多项式的degree为3，也就是说commitment的个数为4：

当round $i > b_{G}$ 时，prover commit的多项式的degree为2，也就是说commitment的个数为3:

Sumcheck Verifications

我们试图把verifier sumcheck 协议中所有round的校验等式且一个矩阵点乘运算表示：

$M \cdot π = ? Q$

其中每个round prover发送的message 为：

$π_{1} π_{2} π_{3} π_{4} π_{5} π_{last} = (c_{0, 1}, c_{1, 1}, c_{2, 1}, c_{3, 1}) = (c_{0, 2}, c_{1, 2}, c_{2, 2}) = (c_{0, 3}, c_{1, 3}, c_{2, 3}) = (c_{0, 4}, c_{1, 4}, c_{2, 4}) = (c_{0, 5}, c_{1, 5}, c_{2, 5}) = (V_{1} (r^{'}, r_{L}), V_{1} (r^{'}, r_{R}), V_{1} (r^{'}, r_{L}) \cdot V_{1} (r^{'}, r_{R}))$

把它们聚合到一个向量里：

$π = c_{0, 1} c_{1, 1} c_{2, 1} c_{3, 1} c_{0, 2} c_{1, 2} c_{2, 2} c_{0, 3} c_{1, 3} c_{2, 3} c_{0, 4} c_{1, 4} c_{2, 4} c_{0, 5} c_{1, 5} c_{2, 5} V_{1} (r^{'}, r_{L}) V_{1} (r^{'}, r_{R}) V_{1} (r^{'}, r_{L}) \cdot V_{1} (r^{'}, r_{R})$

其中每个round verifier 需要验证时用的参数：

$M_{1} M_{2} M_{3} M_{4} M_{5} M_{last} = (2, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0) = (- 1, - r_{1}, - r_{1}^{2}, - r_{1}^{3}, 2, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0) = (0, 0, 0, 0, - 1, - r_{2}, - r_{2}^{2}, 2, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0) = (0, 0, 0, 0, 0, 0, 0, - 1, - r_{3}, - r_{3}^{2}, 2, 1, 1, 0, 0, 0, 0, 0, 0) = (0, 0, 0, 0, 0, 0, 0, 0, 0, 0, - 1, - r_{4}, - r_{4}^{2}, 2, 1, 1, 0, 0, 0) = (0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, - 1, - r_{5}, - r_{5}^{2}, e q (2, r^{'}) \cdot a dd (4, r_{L}, r_{R}), e q (2, r^{'}) \cdot a dd (4, r_{L}, r_{R}), e q (2, r^{'}) \cdot m u l (4, r_{L}, r_{R}))$

把它们聚合到一个矩阵里：

$M = M_{1} M_{2} M_{3} M_{4} M_{5} M_{last}$

每一个round verifier 校验的结果：

$Q = s_{0} 00000$

备注：其中， $s_{0}$ 是第1个round 需要校验的sumcheck 值，是verifier 随机采样的第0层电路编码的evaluation值，也是prover 第1个round要证明的值。

汇总一下就是：

$M \cdot π = M_{1} M_{2} M_{3} M_{4} M_{5} M_{last} \cdot c_{0, 1} c_{1, 1} c_{2, 1} c_{3, 1} c_{0, 2} c_{1, 2} c_{2, 2} c_{0, 3} c_{1, 3} c_{2, 3} c_{0, 4} c_{1, 4} c_{2, 4} c_{0, 5} c_{1, 5} c_{2, 5} V_{1} (r^{'}, r_{L}) V_{1} (r^{'}, r_{R}) V_{1} (r^{'}, r_{L}) \cdot V_{1} (r^{'}, r_{R}) = ? s_{0} 00000$

矩阵 $M$ 需要verifier 自行计算，用红色标记的向量 $π$ 和向量 $Q$ 都是需要prover 进行commit。如果说仍然是一个field对应一个commitment,那么commit之后的校验就变成了:

$M \cdot δ = M_{1} M_{2} M_{3} M_{4} M_{5} M_{last} \cdot δ_{0, 1} δ_{1, 1} δ_{2, 1} δ_{3, 1} δ_{0, 2} δ_{1, 2} δ_{2, 2} δ_{0, 3} δ_{1, 3} δ_{2, 3} δ_{0, 4} δ_{1, 4} δ_{2, 4} δ_{0, 5} δ_{1, 5} δ_{2, 5} X Y Z = ? C_{0} 00000$

有没有觉得向量 $π$ size太大了(19个commitment)？是的，它直接影响着协议过程中的communication cost，所以需要进行压缩处理。

Reducing Sumcheck Commitments

一个field 对应一个commitment: $c_{f_{i}} = [f_{i}]_{g} + [r_{f_{i}}]_{h}$ 每次commit的时候还需要一个blind factor $r_{f_{i}}$ .

这样的话Sumcheck 协议中的commitment个数就会与要commit的多项式的degree成线性关系。如果把一个多项式所有参数的commitment压缩成一个commitment： $c_{f} = i = 1 \sum n [f_{i}]_{g_{i}} + [r_{f}]_{h}$

这样的话就需要多个generator $g_{i}$ 了，但blind factor 变成了一个 $r_{f}$ 。

我们用矩阵第一行的校验为例： $⟨ M_{1}, δ_{, 1} ⟩ = 2 \cdot δ_{0, 1} + δ_{1, 1} + δ_{2, 1} + δ_{3, 1} = C_{0}$

如果把commitment $δ_{i, 1}$ 压缩成一个commitment $δ_{1}$ ，verifier 就无法直接通过上面的等式来进行校验。这其实就转换成了大家所熟知的IPA 证明，即Inner Product Argument verification。接下来简单描述一下IPA协议的执行过程

IPA Protocol Overview

prover 要证明query 向量 $y$ 满足: $⟨ u, y ⟩ = ? v$

Step One

prover 生成多项式的commitment，并发送给verifier

$C_{u} C_{v} = i \sum [u_{i}]_{g_{i}} + [r_{u}]_{h} = [v]_{g} + [r_{v}]_{h}$

Step Two

prover 采样一个与向量 $u$ 等长的向量 $d$ ，对它进行commit；同样也与query 向量 $y$ 交互，结果也进行commit，最后同样也发送给verifier

$C_{d} w C_{w} = i \sum [d_{i}]_{g_{i}} + [r_{1}]_{h} = ⟨ d, y ⟩ = [w]_{g} + [r_{2}]_{h}$

Step Three

verifier 发送一个challenge factor $e$ 给prover，prover 计算 $u^{'} r_{u^{'}} r_{v^{'}} = e \cdot u + d = e \cdot r_{u} + r_{1} = e \cdot r_{v} + r_{2}$

并把它们全部发送给verifier。

Step Four

根据commitment 同态性质，verifier 验证：

$i \sum [u_{i}^{'}]_{g_{i}} + [r_{u^{'}}]_{h} [⟨ u^{'}, y ⟩]_{g} + [r_{v^{'}}]_{h} = e \cdot i \sum [u_{i}]_{g_{i}} + e \cdot [r_{u}]_{h} + i \sum [d_{i}]_{g_{i}} + [r_{1}]_{h} = ? e \cdot C_{u} + C_{d} = e \cdot [⟨ u, y ⟩]_{g} + [⟨ d, y ⟩]_{g} + [r_{v^{'}}]_{h} = ? e \cdot C_{v} + C_{w} + [r_{v^{'}}]_{h}$

Reducing Sumcheck into IPA

最后我们看看Hyrax 中Sumcheck 协议被reduced成IPA 协议后的执行过程：

Step One

把多个verification fold成一个： $J ⟹ ⟨ J, π ⟩ = i = 1 \sum 6 ρ_{i} \cdot M_{i} = (2 ρ_{1} - ρ_{2}) (ρ_{1} - r_{1} ρ_{2}) (ρ_{1} - r_{1}^{2} ρ_{2}) (ρ_{1} - r_{1}^{3} ρ_{2}) (2 ρ_{2} - ρ_{3}) (ρ_{2} - r_{2} ρ_{3}) (ρ_{2} - r_{2}^{2} ρ_{3}) (2 ρ_{3} - ρ_{4}) (ρ_{3} - r_{3} ρ_{4}) (ρ_{3} - r_{3}^{2} ρ_{4}) (2 ρ_{4} - ρ_{5}) (ρ_{4} - r_{4} ρ_{5}) (ρ_{4} - r_{4}^{2} ρ_{5}) (2 ρ_{5} - ρ_{6}) (ρ_{5} - r_{5} ρ_{6}) (ρ_{5} - r_{5}^{2} ρ_{6}) ρ_{6} \cdot (e q (2, r^{'}) \cdot a dd (4, r_{L}, r_{R})) ρ_{6} \cdot (e q (2, r^{'}) \cdot a dd (4, r_{L}, r_{R})) ρ_{6} \cdot (e q (2, r^{'}) \cdot m u l (4, r_{L}, r_{R}))^{T} = ? i = 1 \sum 6 ρ_{i} \cdot Q_{i} = ρ_{0} \cdot s_{0}$

对 $π$ 进行commit： $α_{1} α_{2} α_{3} α_{4} α_{5} X Y Z = i = 1 \sum 4 [c_{i, 1}]_{g_{i}} + [r_{α_{1}}]_{h} = i = 1 \sum 3 [c_{i, 2}]_{g_{i}} + [r_{α_{2}}]_{h} = i = 1 \sum 3 [c_{i, 3}]_{g_{i}} + [r_{α_{3}}]_{h} = i = 1 \sum 3 [c_{i, 4}]_{g_{i}} + [r_{α_{4}}]_{h} = i = 1 \sum 3 [c_{i, 5}]_{g_{i}} + [r_{α_{5}}]_{h} = [v_{0}]_{g} + [r_{X}]_{h} = [v_{1}]_{g} + [r_{Y}]_{h} = [v_{0} \cdot v_{1}]_{g} + [r_{Z}]_{h}$

对 $Q$ 进行commit： $C_{0} = [s_{0}]_{g} + [r_{C_{0}}]_{h}$

commit 之后，prover要证明的变成了： $⟨ J, (α, X, Y, Z)⟩ = ? ρ_{0} \cdot C_{0}$

把两组commitment $α = (α_{1}, α_{2}, α_{3}, α_{4}, α_{5}, X, Y, Z)$ 和 $C_{0}$ 全部发送给verifier。

定义 $J^{*} = J [: - 3]$ ， $π^{*} = π [: - 3]$ ，即剔除掉最后三个元素，则： $⟨ J^{*}, α ⟩ + ⟨ J_{X}, X ⟩ + ⟨ J_{Y}, Y ⟩ + ⟨ J_{Z}, Z ⟩ = ρ_{0} \cdot C_{0} ⇓ i = 1 \sum 5 J_{i} \cdot r_{α_{i}} = ρ_{0} \cdot r_{C_{0}} - J_{X} \cdot r_{X} - J_{Y} \cdot r_{Y} - J_{Z} \cdot r_{Z}$

Step Two

prover 随机生成一个与 $π^{*}$ 等长的向量 $d$ ，同 $π^{*}$ 一样计算它的commitment，及 $⟨ J^{*}, d ⟩$ 的commitment： $δ_{1} δ_{2} δ_{3} δ_{4} δ_{5} C = i = 1 \sum 4 [d_{i, 1}]_{g_{i}} + [r_{δ_{1}}]_{h} = i = 1 \sum 3 [d_{i, 2}]_{g_{i}} + [r_{δ_{2}}]_{h} = i = 1 \sum 3 [d_{i, 3}]_{g_{i}} + [r_{δ_{3}}]_{h} = i = 1 \sum 3 [d_{i, 4}]_{g_{i}} + [r_{δ_{4}}]_{h} = i = 1 \sum 3 [d_{i, 5}]_{g_{i}} + [r_{δ_{5}}]_{h} = [⟨ J^{*}, d ⟩]$

把两组 commitment $δ = (δ_{1}, δ_{2}, δ_{3}, δ_{4}, δ_{5})$ 和 $C$ 全部发送给verifier。

Step Three

verifier 发送一个challenge factor $e$ 给prover，prover 计算： $\overset{◯}{1} \overset{◯}{2} \overset{◯}{3} z_{C} z = ⎩ ⎨ ⎧ z_{1} z_{2} z_{3} z_{4} z_{5} = e \cdot [c_{0, 1}, c_{1, 1}, c_{2, 1}, c_{3, 1}] + [d_{0, 1}, d_{1, 1}, d_{2, 1}, d_{3, 1}] = e \cdot [c_{0, 2}, c_{1, 2}, c_{2, 2}] + [d_{0, 2}, d_{1, 2}, d_{2, 2}] = e \cdot [c_{0, 3}, c_{1, 3}, c_{2, 3}] + [d_{0, 3}, d_{1, 3}, d_{2, 3}] = e \cdot [c_{0, 4}, c_{1, 4}, c_{2, 4}] + [d_{0, 4}, d_{1, 4}, d_{2, 4}] = e \cdot [c_{0, 5}, c_{1, 5}, c_{2, 5}] + [d_{0, 5}, d_{1, 5}, d_{2, 5}] ⎩ ⎨ ⎧ z_{δ_{1}} z_{δ_{2}} z_{δ_{3}} z_{δ_{4}} z_{δ_{5}} = e \cdot r_{α_{1}} + r_{δ_{1}} = e \cdot r_{α_{2}} + r_{δ_{2}} = e \cdot r_{α_{3}} + r_{δ_{3}} = e \cdot r_{α_{4}} + r_{δ_{4}} = e \cdot r_{α_{5}} + r_{δ_{5}} = e \cdot i = 1 \sum 5 J_{i}^{*} \cdot r_{α_{i}} + r_{C} = e \cdot (ρ_{0} \cdot r_{C_{0}} - J_{X} \cdot r_{X} - J_{Y} \cdot r_{Y} - J_{Z} \cdot r_{Z}) + r_{C}$

Step Four

verifier 验证： $\overset{◯}{1} \overset{◯}{2} ⎩ ⎨ ⎧ \sum_{i = 1}^{4} [z_{i, 1}]_{g_{i}} + [z_{δ_{1}}]_{h} = ? e \cdot α_{1} + δ_{1} \sum_{i = 1}^{3} [z_{i, 2}]_{g_{i}} + [z_{δ_{2}}]_{h} = ? e \cdot α_{2} + δ_{2} \sum_{i = 1}^{3} [z_{i, 3}]_{g_{i}} + [z_{δ_{3}}]_{h} = ? e \cdot α_{3} + δ_{3} \sum_{i = 1}^{3} [z_{i, 4}]_{g_{i}} + [z_{δ_{4}}]_{h} = ? e \cdot α_{4} + δ_{4} \sum_{i = 1}^{3} [z_{i, 5}]_{g_{i}} + [z_{δ_{5}}]_{h} = ? e \cdot α_{5} + δ_{5} [⟨ J^{*}, z ⟩]_{g} + [z_{C}]_{h} = ? e \cdot (ρ_{0} \cdot C_{0} - J_{X} \cdot X - J_{Y} \cdot Y - J_{Z} \cdot Z) + C$

到此为止多个round 的Sumcheck verification就被转换成了一个IPA verification，proof size(commitments) 也被进一步压缩。

Reduced Witness Evaluation

Recall

GKR with ZK Argument协议的Final Step是要对最下面一层(input + witness) 的某个evaluation 进行证明，我们仍然用GKR with ZK Argument中的例子： $V_{2} (2, (3, 4)) = ? 2$

需要verifier基于Step ZERO发送过来的每个witness对应的commitment 计算witness MLE上的evaluation值对应的commitment： $w (x_{2}, x_{3}) commit (w (x_{2}, x_{3})) = 2 \cdot (1 - x_{2}) (1 - x_{3}) + 3 \cdot (1 - x_{2}) x_{3} + 2 \cdot x_{2} (1 - x_{3}) + 4 \cdot x_{2} x_{3} ⇓ = commit (2) \cdot (1 - x_{2}) (1 - x_{3}) + commit (3) \cdot (1 - x_{2}) x_{3} + commit (2) \cdot x_{2} (1 - x_{3}) + commit (4) \cdot x_{2} x_{3}$

它的问题在于，需要对每个witness进行commit(上面红色标记的部分)，导致communication cost 和 verification cost都会比较高，与witness的长度成线性关系 $O (∣ w ∣)$ ，Hyrax 对其进行了压缩，变成了子线性关系 $O (∣ w ∣)$ 。

Square-root commitment scheme

Hyrax 在这里的整体思路是，把上面witness evaluation 的commitment的计算代理给了prover，prover 提供计算结果的同时需要提供相应的proof给verifier 验证，当然了verifier 验证的成本肯定要低于自己计算的成本，满足succinct 特性： $O (∣ w ∣) < O (∣ w ∣)$

把witness evaluation 的commitment的证明最终变成了一个IPA 的证明。

实例中 $∣ w ∣ = 2^{l} = 4, l = 2$ 。

Evaluation and Proof

prover 把witness 向量 $w$ 转换成一个矩阵 $T$ 表示， $T_{i + 2^{l /2} \cdot j}$ 其中 $i 、 j$ 分别代表行和列： $T = [w_{0} w_{1} w_{2} w_{3}]$

按行进行commit： $T_{1} = [w_{0}]_{g_{1}} + [w_{2}]_{g_{2}} + [r_{T_{1}}]_{h} T_{2} = [w_{1}]_{g_{1}} + [w_{3}]_{g_{2}} + [r_{T_{2}}]_{h}$

把witness的commitment $T_{1} 、 T_{2}$ 连同evaluation 的commitment $ω$ 一起发送给verifier。

Compressed Lagrange Basis

基于MLE 多项式： $w (r_{1}, r_{2}, \dots, r_{l}) = b \in {0, 1}^{l} \sum w (b) \cdot k \in {1, 2, \dots, l} \prod χ_{b_{k}} (r_{k})$

我们把Lagrange Basis Polynomial $χ_{b}$ 一拆为二： $\overset{χ}{ˇ}_{b} \overset{χ}{ˆ}_{b} L R = k = 1 \prod l /2 χ_{b_{k}} (r_{k}) = k = l /2 + 1 \prod l χ_{b_{k}} (r_{k}) = (\overset{χ}{ˇ}_{0}, \overset{χ}{ˇ}_{1}, \dots, \overset{χ}{ˇ}_{2^{l /2} - 1}) = (\overset{χ}{ˆ}_{0}, \overset{χ}{ˇ}_{w^{l /2}}, \dots, \overset{χ}{ˇ}_{2^{l /2} \cdot (2^{l /2} - 1)})$

结合上面的witness 矩阵 $T$ ，一定有： $L \cdot T \cdot R = b \in {0, 1}^{l} \sum w (b) \cdot k \in {1, 2, \dots, l} \prod χ_{b_{k}} (r_{k}) = w (r_{1}, r_{2}, \dots, r_{l})$

通过两组 $n$ 的子向量来represent 长度为 $n$ 的整个向量，这里应该是一种很常见的succinct 做法。比如protostar 论文中3.5 节compressed verification也是采用了这种技巧，细节可以参考 https://learnblockchain.cn/article/6503

所以verifier 需要自己计算拿到两个向量(为了简化，实例中 $∣ w ∣ = 4$ ，所以 $2 ∣ w ∣ = 4$ 其实是没有起到compress作用的，如果 $∣ w ∣ > 4$ compress 效果就出来了，读者可以自行举例)： $L = (\overset{χ}{ˇ}_{0}, \overset{χ}{ˇ}_{1}) R = (\overset{χ}{ˇ}_{2}, \overset{χ}{ˇ}_{3})$

并计算得到： $T^{'} = k = 1 \sum L_{k} \cdot T_{k}$ 其中 $T_{k}$ 为commitment， $L_{k}$ 为verifier 刚计算好的scalar，最终verifier 拿到一个commitment $T^{'}$ 。

IPA for Evaluation Verification

最终verifier 需要对prover 提供的evaluation的commitment进行验证，这时的验证就变成了标准的IPA 验证： $⟨ T^{'}, R ⟩ = ? ω$

关于IPA 的执行过程这里就不再赘述了，可以参考上面的IPA Protocol Overview。

Summary

到此，Hyrax 协议也就完整了。简单总结一下，Hyrax 本质就是一套GKR 协议，它在proof size 和 verification 方面做了一些工作。

References

【1】Hyrax 论文：https://eprint.iacr.org/2017/1132.pdf

【2】PAZK by Thaler：https://people.cs.georgetown.edu/jthaler/ProofsArgsAndZK.pdf

【3】protostar compressed verification: https://learnblockchain.cn/article/6503

作者: 白菜
标签: Sumcheck, IPA, GKR, Hyrax, VSM, Spice, Spark, Spartan
时间: 2023-10-06

Table of Content

Motivation

缘于folding，缘于NOVA，缘于Setty，了解到了Spartan，但当时并不认识它，所以才有了本篇及前两篇前置[3] 和[7]……

关于Spartan，在ZK领域可能时间上相对也有点儿远了，暂且不考虑它在某些方面的争议，它的一些思想其实已经影响到其它比较热门的方向了，比如当下的热点Lasso & Jolt，所以它的研究意义仍然很大，尤其是其中的Spark。

Introduction

本文是Spartan [4] research的终结篇，将重点囊括Spark 和 Spice [1]，前两篇[3] 和 [7] 是本篇的预备部分，如果对Sumcheck 不熟悉，也可以参考一下[6]。

Spark 是Spartan 整个协议的core part，Memory Check是Spark 的core part，而VSM又是Memory Check或者Spice的core part。本篇文章将从内向外延伸，读者尽管从感兴趣的地方切入即可。

VSM in Spice

VSM，全称Verifiable State Machine，这个概念源自Spice[1]。

它的一个intuitive 的理解就是：把任何一个storage 对象当作一个State Machine，在这个State Machine上的任何operation 导致其state 的transition 都可以生成相应的proof 给verifier 验证。这就是所谓的Verifiable State Machine。

以单个Query或者read operation为例，我们看看Spice 中的VSM 长什么样子： Alt text

关于Spice的其它细节这里不展开，大家可以参考原始资料Spice [1]。

Takeaways

Spice 有两个drawback 或者特性：其一，批量验证，也就是n 个operation之后一起验证，成本会平摊到每个operation上，所以成本会很低，但会有时间上的delay；其二，如果验证不通过，是无法判断哪个operation 出的问题

Storage 作为三方一个独立存在的个体，state 通常以key-value-timestamp的格式出现，它相比传统的key-value 的Storage 的区别就是加了一个可以表征State Machine的非常关键元素Timestamp

Prover 自身维护两个set state $RS$ 和 $W S$ ，发送一个query/read operation 会更新本地的这两个set state $RS$ 和 $W S$ ，并update Storage的state $A u d i t$ ，发送一个write operation 会更新本地的state $W S$ ，并update Storage 的state $A u d i t$

Verifier 拿着更新前的state $I ni t$ ，和更新后的state $A u d i t$ ，以及operaton 过程产生的中间state 或者proof $RS / W S$ ，进行最后的验证，验证通过说明返回的结果没有问题

Memory Check for Spark

Spark 中Memory Check 的核心思想源自Spice[1]，Spice 支持读、写操作的验证，而Spark 中只需要具备lookup 功能的验证，所以可以简单理解为read-only 版本的Spice。

验证query/lookup 的结果对与不对，上一节我们提到过，这里我们就以Spartan为背景，举个实例detail一下它的执行过程，可以回答大家可能比较关心的两个问题：1. memory check 究竟解决的是什么问题？2. 为什么它可以work？

Problem

假定有这么两个query 向量： $a dd r_{ro w} = [0, 0, 1, 1, 1, 2, 3, 3] a dd r_{co l} = [0, 2, 0, 1, 3, 2, 0, 2]$

另外，假定： $(r_{x}, r_{y}) = ((2, 3), (3, 4))$

以及相应的两个Storage 对象，或者叫lookup table $m e m_{ro w} 、 m e m_{co l}$ ： $i 0123 m e m_{ro w} = e q (i, r_{x}) (1 - 2) \cdot (1 - 3) = 2 (1 - 2) \cdot 3 = 2 2 \cdot (1 - 3) = 1 2 \cdot 3 = 1 j 0123 m e m_{co l} = e q (j, r_{y}) (1 - 3) \cdot (1 - 4) = 2 (1 - 3) \cdot 4 = 2 3 \cdot (1 - 4) = 1 3 \cdot 4 = 2$

query 的过程：给定 $ro w_{a dd r} / co l_{a dd r}$ 向量中的某个元素值，返回相应table 中evaluation值。比如请求 $a dd r_{ro w} [5] = 2$ ，返回 $e q (2, r_{x}) = 1$ 。

为了简化，以下实例我们均以query $a dd r_{ro w} = [0, 0, 1, 1, 1, 2, 3, 3]$ 为例。如何证明它的返回结果 $e_{ro w} = [2, 2, 2, 2, 2, 1, 1, 1]$ 是正确的呢？这里我们detail 一下上一节中VSM 的逻辑。

Resolution

Initialization

lookup table $m e m_{ro w}$ 最开始的State： $I ni t_{ro w} = [(0, 2, 0), (1, 2, 0), (2, 1, 0), (3, 1, 0)]$

Operation

批量query $a dd r_{ro w} = [0, 0, 1, 1, 1, 2, 3, 3]$ 之后， $m e m_{ro w}$ 的State 变成了： $A u d i t_{ro w} = [(0, 2, 2), (1, 2, 3), (2, 1, 1), (3, 1, 2)]$

批量query $a dd r_{ro w} = [0, 0, 1, 1, 1, 2, 3, 3]$ 之后，prover 这边维护的两个中间State 或者proof 为： $R S_{ro w} = [(0, 2, 0), (0, 2, 1), (1, 2, 0), (1, 2, 1), (1, 2, 2), (2, 1, 0), (3, 1, 0), (3, 1, 1)] W S_{ro w} = [(0, 2, 1), (0, 2, 2), (1, 2, 1), (1, 2, 2), (1, 2, 3), (2, 1, 1), (3, 1, 1), (3, 1, 2)]$

Verification

批量query 之前，verifier 请求拿到 $m e m_{ro w}$ 的初始State $I ni t_{ro w}$ ；批量query $a dd r_{ro w} = [0, 0, 1, 1, 1, 2, 3, 3]$ 之后，verifier 请求得到 $m e m_{ro w}$ 的最新State $A u d i t_{ro w}$ ，再结合prover 传递过来的proof $R S_{ro w} / W S_{ro w}$ 进行最后的验证： $I ni t_{ro w} \cup W S_{ro w} = ? A u d i t_{ro w} \cup R S_{ro w}$

接下来的问题是，如何把上面的计算过程算术化？

Arithmetic

$I ni t_{ro w} \cup W S_{ro w} = ? A u d i t_{ro w} \cup R S_{ro w}$

这个等式本质是要判定两个set 是否相等？也就是说是一个permutaion的问题，自然就会联想到plonk 里lookup contrain用到的grand-product 的逻辑，也就是说： $[(0, 2, 0), (1, 2, 0), (2, 1, 0), (3, 1, 0)] \cup [(0, 2, 1), (0, 2, 2), (1, 2, 1), (1, 2, 2), (1, 2, 3), (2, 1, 1), (3, 1, 1), (3, 1, 2)] = ? [(0, 2, 2), (1, 2, 3), (2, 1, 1), (3, 1, 2)] \cup [(0, 2, 0), (0, 2, 1), (1, 2, 0), (1, 2, 1), (1, 2, 2), (2, 1, 0), (3, 1, 0), (3, 1, 1)]$

演变成了： $(0, 2, 0) \cdot (1, 2, 0) \cdot (2, 1, 0) \cdot (3, 1, 0) \cdot (0, 2, 1) \cdot (0, 2, 2) \cdot (1, 2, 1) \cdot (1, 2, 2) \cdot (1, 2, 3) \cdot (2, 1, 1) \cdot (3, 1, 1) \cdot (3, 1, 2) = ? (0, 2, 2) \cdot (1, 2, 3) \cdot (2, 1, 1) \cdot (3, 1, 2) \cdot (0, 2, 0) \cdot (0, 2, 1) \cdot (1, 2, 0) \cdot (1, 2, 1) \cdot (1, 2, 2) \cdot (2, 1, 0) \cdot (3, 1, 0) \cdot (3, 1, 1)$

很显明三元组的元素是无法直接相乘的，引入两个challenge factor $γ_{1} 、 γ_{2}$ 把三元组的元素合成一个field： $H_{γ_{1}, γ_{2}} (a, v, t) = (a \cdot γ_{1}^{2} + v \cdot γ_{1} + t) - γ_{2}$

因此上面的等式就变成了： $H_{γ_{1}, γ_{2}} (0, 2, 0) \cdot H_{γ_{1}, γ_{2}} (1, 2, 0) \cdot H_{γ_{1}, γ_{2}} (2, 1, 0) \cdot H_{γ_{1}, γ_{2}} (3, 1, 0) \cdot H_{γ_{1}, γ_{2}} (0, 2, 1) \cdot H_{γ_{1}, γ_{2}} (0, 2, 2) \cdot H_{γ_{1}, γ_{2}} (1, 2, 1) \cdot H_{γ_{1}, γ_{2}} (1, 2, 2) \cdot H_{γ_{1}, γ_{2}} (1, 2, 3) \cdot H_{γ_{1}, γ_{2}} (2, 1, 1) \cdot H_{γ_{1}, γ_{2}} (3, 1, 1) \cdot H_{γ_{1}, γ_{2}} (3, 1, 2) = ? H_{γ_{1}, γ_{2}} (0, 2, 2) \cdot H_{γ_{1}, γ_{2}} (1, 2, 3) \cdot H_{γ_{1}, γ_{2}} (2, 1, 1) \cdot H_{γ_{1}, γ_{2}} (3, 1, 2) \cdot H_{γ_{1}, γ_{2}} (0, 2, 0) \cdot H_{γ_{1}, γ_{2}} (0, 2, 1) \cdot H_{γ_{1}, γ_{2}} (1, 2, 0) \cdot H_{γ_{1}, γ_{2}} (1, 2, 1) \cdot H_{γ_{1}, γ_{2}} (1, 2, 2) \cdot H_{γ_{1}, γ_{2}} (2, 1, 0) \cdot H_{γ_{1}, γ_{2}} (3, 1, 0) \cdot H_{γ_{1}, γ_{2}} (3, 1, 1)$

接下来的问题是，如何把上面的算术逻辑放在电路里，以便通过某个或者某几个协议来完成它的验证？

Circuit

我们把上面的等式grand-product 拆分成四个部分： $H_{γ_{1}, γ_{2}} (I ni t_{ro w}) H_{γ_{1}, γ_{2}} (W S_{ro w}) H_{γ_{1}, γ_{2}} (A u d i t_{ro w}) H_{γ_{1}, γ_{2}} (R S_{ro w}) = H_{γ_{1}, γ_{2}} (0, 2, 0) \cdot H_{γ_{1}, γ_{2}} (1, 2, 0) \cdot H_{γ_{1}, γ_{2}} (2, 1, 0) \cdot H_{γ_{1}, γ_{2}} (3, 1, 0) = H_{γ_{1}, γ_{2}} (0, 2, 1) \cdot H_{γ_{1}, γ_{2}} (0, 2, 2) \cdot H_{γ_{1}, γ_{2}} (1, 2, 1) \cdot H_{γ_{1}, γ_{2}} (1, 2, 2) \cdot H_{γ_{1}, γ_{2}} (1, 2, 3) \cdot H_{γ_{1}, γ_{2}} (2, 1, 1) \cdot H_{γ_{1}, γ_{2}} (3, 1, 1) \cdot H_{γ_{1}, γ_{2}} (3, 1, 2) = H_{γ_{1}, γ_{2}} (0, 2, 2) \cdot H_{γ_{1}, γ_{2}} (1, 2, 3) \cdot H_{γ_{1}, γ_{2}} (2, 1, 1) \cdot H_{γ_{1}, γ_{2}} (3, 1, 2) = H_{γ_{1}, γ_{2}} (0, 2, 0) \cdot H_{γ_{1}, γ_{2}} (0, 2, 1) \cdot H_{γ_{1}, γ_{2}} (1, 2, 0) \cdot H_{γ_{1}, γ_{2}} (1, 2, 1) \cdot H_{γ_{1}, γ_{2}} (1, 2, 2) \cdot H_{γ_{1}, γ_{2}} (2, 1, 0) \cdot H_{γ_{1}, γ_{2}} (3, 1, 0) \cdot H_{γ_{1}, γ_{2}} (3, 1, 1)$

假定这四组向量都是witness，用GKR-like layered circuit 来把这四个grand-product 的计算trace 给描述出来，通过Hyrax [2] 协议来完成grand-product 的验证，最后验证四个grand-product 的结果是否满足等式即可： $H_{γ_{1}, γ_{2}} (I ni t_{ro w}) \cdot H_{γ_{1}, γ_{2}} (W S_{ro w}) = ? H_{γ_{1}, γ_{2}} (A u d i t_{ro w}) \cdot H_{γ_{1}, γ_{2}} (R S_{ro w})$

我们用图直观感受一下这四个电路长什么样子？

Circuit for $I ni t_{ro w}$ : Alt text

Circuit for $W S_{ro w}$ : Alt text

Circuit for $A u d i t_{ro w}$ : Alt text

Circuit for $R S_{ro w}$ : Alt text

熟悉Hyrax 协议的应该知道，Hyrax协议是由多个Sumcheck 协议与一个IPA协议组成 [3]。Hyrax 的最后需要计算tree 的叶子节点，也就是witness向量，的MLE 多项式在某个opening $r$ 上的evaluation，它是通过一个IPA协议来完成的。

也就是说，在这里我们分别需要通过IPA协议完成四个evaluation 的验证： $H_{γ_{1}, γ_{2}} (I ni t_{ro w} (r)) H_{γ_{1}, γ_{2}} (W S_{ro w} (r)) H_{γ_{1}, γ_{2}} (A u d i t_{ro w} (r)) H_{γ_{1}, γ_{2}} (R S_{ro w} (r)) = ? v_{I ni t} = ? v_{W S} = ? v_{A u d i t} = ? v_{RS} ⎭ ⎬ ⎫$

等式右边的四个evaluation值是通过Sumcheck 协议reduce 后拿到的。

$H_{γ_{1}, γ_{2}} (a, v, t)$ 是由相应的三元组 $a 、 v 、 t$ ，即 $a dd r 、 v a l 、 t s$ 组成。所以上面的四个evaluation 需要进行再次拆解。

for $H_{γ_{1}, γ_{2}} (I ni t_{ro w})$ evaluation

$a dd r_{I ni t} (r_{a dd r}) m e m_{I ni t} (r_{m e m}) t s_{I ni t} (r_{t s}) = ? v_{I ni t} . v_{a dd r} = ? v_{I ni t} . v_{m e m} = ? v_{I ni t} . v_{t s}$

三个dense 向量或者witness 为：

$a dd r 0123 m e m 2211 t s_{ini t} 0000$

用3个IPA协议去验证以上三个MLE 的evaluation值是否合法。

for $H_{γ_{1}, γ_{2}} (W S_{ro w})$ evaluation

$a dd r_{W S} (r_{a dd r}) e_{W S} (r_{e}) t s_{W S} (r_{t s}) = ? v_{W S} . v_{a dd r} = ? v_{W S} . v_{e} = ? v_{W S} . v_{t s}$

三个dense 向量或者witness 为： $a dd r_{W S} 00111233 e_{W S} 22222111 t s_{W S} 12123112$

用3个IPA协议去验证以上三个MLE 的evaluation值是否合法。

for $H_{γ_{1}, γ_{2}} (A u d i t_{ro w})$ evaluation

$a dd r_{A u d i t} (r_{a dd r}) m e m_{A u d i t} (r_{m e m}) t s_{A u d i t} (r_{t s}) = ? v_{A u d i t} . v_{a dd r} = ? v_{A u d i t} . v_{m e m} = ? v_{A u d i t} . v_{t s}$

三个dense 向量或者witness 为：

$a dd r 0123 m e m 2211 t s_{ini t} 2312$

用3个IPA协议去验证以上三个MLE 的evaluation值是否合法。

for $H_{γ_{1}, γ_{2}} (R S_{ro w})$ evaluation

$a dd r_{RS} (r_{a dd r}) e_{RS} (r_{e}) t s_{RS} (r_{t s}) = ? v_{RS} . v_{a dd r} = ? v_{RS} . v_{e} = ? v_{RS} . v_{t s}$

三个dense 向量或者witness 为： $a dd r_{W S} 00111233 e_{W S} 22222111 t s_{W S} 01012001$

用3个IPA协议去验证以上三个MLE 的evaluation值是否合法。

到此为止，Spark 中memory check 的逻辑就完整了！关于Spark 的应用在Brakedown [5]中也有应用，感兴趣的话也可以参考一下。

最后我们再revisit 一下之前提到的两个问题：

Info

memory check 究竟解决的是什么问题？又为什么可以work？

抽象地说是，Verifiable Random Access Memory，简称vRAM。把对内存访问结果的验证转换成一个Verifiable State Machine，简称VSM，的问题，也就是一个可验证的state transition的问题，最后通过电路的形式把state transition验证计算的trace 表达出来。

接下来我们就可以非常轻松的review 一下Spark 了。

Spark Overview

Target of Spark

以 $O (n)$ 的时间复杂度完成Sparse Matrix Polynomial 的evaluation。

比如，有一个Sparse Matrix: $M = 1, 0, 2, 0 2, 4, 0, 3 0, 0, 1, 0 3, 0, 4, 0$

其中涉及到的常量： $m = 4 n = 8 s = lo g m = 2 u = 2 s = 4$

$m$ 代表矩阵的行数/列数， $n$ 代表矩阵中non-zero 元素的个数， $u$ 代表matrix dense MLE中的变量个数。

上面这个matrix 的dense MLE 可以表示为： $M (r_{x}, r_{y}) = x \in {0, 1}^{s}, y \in {0, 1}^{s} \sum M (x, y) \cdot e q (x, r_{x}) \cdot e q (y, r_{y})$

因为是dense 的表达，所以默认 $M (x, y)$ 是按顺序遍历的，一共有 $m^{2} \cdot 2 s = m^{2} \cdot 2 lo g m$ 次乘法运算，即时间复杂度为 $O (m^{2} \cdot lo g m)$ ，成本随着 $m$ 的增大，会呈现asymptotic 式的增长。在Spartan中， $m$ 又代表R1CS 的gate 数量，这种特征就会体现得更明显。

Spark 把sparse matrix 的evaluation代理给prover，并通过memory check 的消除这种asymptotic，把它的时间复杂度控制在 $O (n)$ ，跟R1CS 的gate 数量无关了，仅仅跟Sparse 的呈度有关。因此，matrix 越稀疏，它的优势就体现得越明显。即 $n ≪ m^{2}$

Technic in Spark

首先，Spark不再用矩阵表达了，而是换作三个向量来表达： $a dd r_{ro w} a dd r_{co l} v a l = [0, 0, 1, 1, 1, 2, 3, 3] = [0, 2, 0, 1, 3, 2, 0, 2] = [1, 2, 2, 4, 3, 1, 3, 4]$

其次，Spark 改变了MLE evaluation 的多项式： $M (r_{x}, r_{y}) = x = 0 \sum x < n v a l (x) \cdot e q (a dd r_{ro w} (x), r_{x}) \cdot e q (a dd r_{co l} (x), r_{y})$

假定 $(r_{x}, r_{y}) = ((2, 3), (3, 4))$ ，通过时间复杂度为 $O (m)$ 的计算，可以拿到两个类似lookup table的东西 $m e m_{ro w} 、 m e m_{co l}$ ： $i 0123 m e m_{ro w} = e q (i, r_{x}) (1 - 2) \cdot (1 - 3) = 2 (1 - 2) \cdot 3 = 2 2 \cdot (1 - 3) = 1 2 \cdot 3 = 1 j 0123 m e m_{co l} = e q (j, r_{y}) (1 - 3) \cdot (1 - 4) = 2 (1 - 3) \cdot 4 = 2 3 \cdot (1 - 4) = 1 3 \cdot 4 = 2$

通过查表的方式，我们很容易拿到 $e_{ro w} (x) = e q (a dd r_{ro w} (x), r_{x})$ 和 $e_{ro w} (x) = e q (a dd r_{co l} (x), r_{x})$ 的取值： $x 000001010011100101110111 v a l (x) 12243134 e_{ro w} (x) 22222111 e_{co l} (x) 21222121 M (x) 44312114$

因此我们可以得到sparase matrix 在 $(r_{x}, r_{y}) = ((2, 3), (3, 4))$ 上的evaluation值 $M (r_{x}, r_{y}) = 0$ 。接下来prover 要做的就是生成相应的proof ： $M (r_{x}, r_{y}) ⇓ M (r) = x = 0 \sum x < n v a l (x) \cdot e q (a dd r_{ro w} (x), r_{x}) \cdot e q (a dd r_{co l} (x), r_{y}) = x \in {0, 1}^{l o g n} \sum [v a l (x) \cdot i = 1 \prod i < l o g n (x_{i} \cdot r_{i} + (1 - x_{i}) \cdot (1 - r_{i}))] \cdot [e_{ro w} (x) \cdot j = 1 \prod j < l o g n (x_{j} \cdot r_{j} + (1 - x_{j}) \cdot (1 - r_{j}))] \cdot [e_{co l} (x) \cdot k = 1 \prod k < l o g n (x_{k} \cdot r_{k} + (1 - x_{k}) \cdot (1 - r_{k}))] = ? 0$

本质是要证明三个多项式乘积的sum 等于0，这是一个标准的degree为3的Sumcheck。Sumcheck 的last round 需要验证： $v a l (r^{'}) \cdot e_{ro w} (r^{'}) \cdot e_{co l} (r^{'}) = ? v_{l a s t}$

其中 $v_{l a s t}$ Sumcheck 最后reduced 得到的claim，左边的三个term，其中 $v a l (r^{'}) = ? v_{v a l}$ 可以轻易地通过一个IPA 协议证明得到；但是， $e_{ro w} (r^{'}) 、 e_{co l} (r^{'})$ 呢？也直接可以通过IPA 协议证明吗？

不行！细心地会发现上面的表中 $e_{ro w} (x) 、 e_{co l} (x)$ 并不是跟 $v a l (x)$ 一样以determined dense vector 或者 determined witness的形式出现在verifier 面前的，对于verifier 来说，它只知道有： $a dd r_{ro w} a dd r_{co l} v a l = [0, 0, 1, 1, 1, 2, 3, 3] = [0, 2, 0, 1, 3, 2, 0, 2] = [1, 2, 2, 4, 3, 1, 3, 4]$ 这三样determined 的东西， $e_{ro w} (x) 、 e_{co l} (x)$ 是prover 基于 $a dd r_{ro w} 、 a dd r_{co l}$ 通过查表 $m e m_{ro w}$ 和 $m e m_{co l}$ 拿到的，对于verifier来说叫做non-determined witness，也是一种中间过程变量。因此还需要一个验证查表过程的电路，来保证它们的来历合规合法！

剩下的就是memory check的show time，上节已经detail 了它的整个过程，这里就不再赘述。

到此为止，Spark是如何更高效地解决Sparse Matrix evaluation 问题的就已经解释清楚了。文章的最后我们就可以非常轻松地revisit一下 Spartan 的整个协议了。

Spartan Protolcol Overview

假定，有这么一个业务计算： $f (x) = x^{3} + 3, x \in F_{11}$

setup 阶段构造R1CS Instance： $A = 100010001000003 B = 110000000000001 C = 000100010001000$

这是非常典型的sparse matrix，可以充分发挥Spark的优势！

prover 填充向量 $z$ : $z = 24801$

令： $v_{A} (x) v_{B} (x) v_{C} (x) = y \in {0, 1}^{s} \sum A (x, y) \cdot z (y) = [(1 - x_{1}) (1 - x_{2}) * A_{0} \cdot z + (1 - x_{1}) x_{2} * A_{1} \cdot z + x_{1} (1 - x_{2}) * A_{2} \cdot z + x_{1} x_{2} * A_{3} \cdot z] = y \in {0, 1}^{s} \sum B (x, y) \cdot z (y) = [(1 - x_{1}) (1 - x_{2}) * B_{0} \cdot z + (1 - x_{1}) x_{2} * B 1 \cdot z + x_{1} (1 - x_{2}) * B_{2} \cdot z + x_{1} x_{2} * B_{3} \cdot z] = y \in {0, 1}^{s} \sum C (x, y) \cdot z (y) = [(1 - x_{1}) (1 - x_{2}) * C_{0} \cdot z + (1 - x_{1}) x_{2} * C_{1} \cdot z + x_{1} (1 - x_{2}) * C_{2} \cdot z + x_{1} x_{2} * C_{3} \cdot z]$

其中 $A_{0}$ 代表矩阵 $A$ 的第0行，同理 $A_{1}$ 、 $A_{2}$ … $B_{0}$ …

还有： $F (x) = v_{A} (x) \cdot v_{B} (x) - v_{C} (x)$

prover 需要证明： $F (x) = 0, \forall x \in {0, 1}^{s}$

令： $Q (τ) = x \in {0, 1}^{s} \sum F (x) \cdot eq (x, τ), \forall τ \in F^{s} = x \in {0, 1}^{s} \sum F (x) \cdot i = 0 \prod s [x_{i} r_{τ_{i}} + (1 - x_{i}) (1 - r_{τ_{i}})]$

实例中， $s = 2$ : $Q (τ) = F (00) \cdot [(1 - τ_{0}) (1 - τ_{1})] + F (01) \cdot [(1 - τ_{0}) τ_{1}] + F (10) \cdot [τ_{0} (1 - τ_{1})] + F (11) \cdot [τ_{0} τ_{1}]$

假设：

$Q (τ) = 0, \forall τ \in F^{s}$

上面红色部分等于0的概率就非常低，因为 $τ$ 的domain是整个field，等于0或者1的概率自然就非常小几乎可以忽略，那么我们就可以推出：

$F (x) = 0, \forall x \in {0, 1}^{s}$

Round One

verifier 随机给定一个challenge factor $r_{τ} \in F^{s}$ ，prover 只需要证明：

$Q (r_{τ}) = x \in {0, 1}^{s} \sum F (x) \cdot eq (x, r_{τ}) = x \in {0, 1}^{s} \sum F (x) \cdot i = 0 \prod s [x_{i} r_{τ_{i}} + (1 - x_{i}) (1 - r_{τ_{i}})] = ? 0$

这是典型的degree 为3的Sumcheck（三个MLE polynomial的乘法），Sumcheck 的最后reduce 成： $（ v_{A} (r_{x}) \cdot v_{B} (r_{x}) - v_{C} (r_{x})) \cdot e q (r_{x}, r_{τ}) = ? v_{x}$

其中 $e q (r_{x}, r_{τ})$ verifier 可以自行计算，但 $v_{A} (r_{x}) 、 v_{B} (r_{x}) 、 v_{C} (r_{x})$ 隐藏着witness信息，需要prover 计算完成之后发送 $v_{A} 、 v_{B} 、 v_{C}$ 给verifier，verifier 完成上述等式验证。

Round Two

接着prover 需要证明：

这又是典型的degree 为2的Sumcheck（两个MLE polynomial的乘法），Sumcheck的最后reduce成： $A (r_{x}, r_{y}) \cdot z (r_{y}) = ? v_{A}^{'} B (r_{x}, r_{y}) \cdot z (r_{y}) = ? v_{B}^{'} C (r_{x}, r_{y}) \cdot z (r_{y}) = ? v_{C}^{'}$

Round Three

上述等式中 $z (r_{y})$ evaluation 的证明可以直接通过IPA 协议来完成，而 $A (r_{x}, r_{y})$ evaluation 的证明就需要Spark 协议来完成了。

剩下的就是Spark的show time，上节已经detail 了它的整个过程，这里就不再赘述。到此为止，Spartan 整个协议的详细逻辑就完整了！

One more thing

纵观Spartan 整套协议，里面穿插着大量的Sumcheck 协议、IPA 协议，工程实现中应该会有相应的proof aggregation 的操作，具体细节可以参考Spartan [4]中的7.23 节和 8节。

Thanks

本着research 的原则，边“猜”paper 作者的意图边手动推理论证，试图用逻辑说服自己，期间免不了叨扰@even @郭宇老师来求证自己的“猜想”，真诚表达对他们的感谢
再次感谢SecbitLabs @郭宇老师前两个月分享的Spartan Overview，视频链接暂时找不到了，后续再补上；再次感谢SecbitLabs @even 关于Spartan在研究方向上的指引

References

[1] Spice: https://eprint.iacr.org/2018/907.pdf

[2] Hyrax: https://eprint.iacr.org/2017/1132.pdf

[3] Spartan 预备知识：Hyrax: https://learnblockchain.cn/article/6586

[4] Spartan: https://eprint.iacr.org/2019/550.pdf

[5] Brakedown：https://eprint.iacr.org/2021/1043.pdf

[6] GKR 协议系列之Sum-Check: https://learnblockchain.cn/article/6188

[7] Spartan 预备知识：GKR with ZK Argument: https://learnblockchain.cn/article/6566

如果你是一个SNARKER，你一定听说过KZG Commitment，如果你听说过KZG Commitment，那你一定知道Pairing。这就是我们接下来要讨论的，大家如果想了解Pairing 的底层逻辑(pairing primitives)，或者对它的应用感兴趣都可以留言，或者添加文末的联系方式。

至今距离pairing 的“尘埃落定”其实已经大概有6、7年的时间了，网上的资料很完整，但关于它的讨论(工程上)仍未止步，比如On Proving Pairings.

本文所有内容源自hackmd上的note，欢迎follow.

这里没有的

group theory, field theory and homomorphism

相关基本概念在这里不会涵盖，详情请查阅任何abstract algebraic 相关的书籍
divisors

相关基本概念在这里不会涵盖，对于了解Pairing 来说 Pairing for Beginners 已足够，如果你还想深入理解最好翻阅一下 algebraic geometry 相关的书籍
structure of elliptic curve over finite field and its arithmetics (scalar multiplication)

理论和算法部分这里不会涵盖，详情可以查阅 Guide to Elliptic Curve Cryptography
hash to curve

bytes string 映射到 $G_{1}$ 或者 $G_{2}$ 上的点，简单说就是hash，是pairing 应用层面必备的一大模块，后续会详细补充这块内容
non-affine coordinate

affine coordinate 其实只是椭圆曲线元素表达的需要，它的scalar multiplication 并不经济，所以实际计算上都会用non-affine coordinate 来替代，后续会补上这块内容
advanced scalar multiplication algorithms GLV/GLS

特定的曲线上充分利用同态映射来加速scalar multiplication，同时还能(GPU)并行化处理也是当下硬件加速卖点，后续也会再补上

这里有的

本篇文章集中讨论了各种Pairing 变体:

和它们的具体实现。除此之外，我们还包含了一些重要的实现层面的tricks，尤其是:

关于代码

python implementation

主要集中在Pairing的计算逻辑上，包括Miller Loop 和 Final Exponentiation。目前已经完成验证。

Finite Field 和 Elliptic Curves的算术运算并没有逐一实现，用的是Sagemath库自带的 Galois Field and Elliptic Curve.
rust implementation

从零着手，从 Bigint 算术运算到 Finite Field 算术运算到 Elliptic Curve 算术运算，再到 Pairings Primitives。底层的逻辑已经验证完毕，目前在Pairings验证过程中 …

公共信息

Modulus of base prime field (characteristic) $F_{p}$ with 381-bits: $p = 4002409555221667393417789825735904156556882819939007885332058136124031650490837864442687629129015664037894272559787$

Embedding degree, or the degree of full extension field $F_{p^{k}}$ : $k = 12$

Elliptic Curve (additive group) over base prime field $F_{p}$ : $G_{1} / E (F_{p}) : y^{2} = x^{3} + 4$

Elliptic Curve (additive group) over extension field $F_{p^{k}}$ : $G_{2} / E (F_{p^{k}}) : y^{2} = x^{3} + 4$

Largest prime factor of $∣ E (F_{p}) ∣$ with 255-bits: $r = 52435875175126190479447740508185965837690552500527637822603658699938581184513$

Trace of Frobenius: $t = p + 1 - ∣ E (F_{p}) ∣ = - 15132376222941642751$

Parameter for BLS12 Pairing-family: $x = - 15132376222941642752$ for: $r (x) p (x) t (x) = x^{4} - x^{2} + 1 = (x - 1)^{2} \cdot r (x) \cdot \frac{1}{3} + x = x + 1$

Target (multiplicative) group with order $r$ defined over $F_{p^{k}}$ : $G_{T} : F_{p^{k}}^{\times} [r]$

Pairing 的演进

Weil Reciprocity

$g$ and $f$ 是两个定义在椭圆曲线上的divisor function, $f, g \in K (E)$ ，它们的divisor support 不存在交集, $s u pp ((f)) \land s u pp ((g)) = \emptyset$ 。然后我们就有:

$g ((f)) \equiv f ((g))$

其中 $(f)$ 表示函数 $f$ 的divisor, $g ((f))$ 表示divisor $(g)$ 在函数 $g$ 上的evaluation。 $f ((g))$ 也类似.

如果我们放松上面的约束条件, 如果 $s u pp ((f)) \land s u pp ((g)) \neq = \emptyset$ , 然后就有一个更general 的 Weil Reciprocity 公式: $g ((f)) \equiv ϵ ((f), (g)) \cdot f ((g))$ 其中 $ϵ ((f), (g)) = 1$ ，当两个divisor $(f)$ and $(g)$ 的support 存在交集, 否则 $ϵ ((f), (g)) = - 1$ .

Details of general definition of Weil Reciprocity, you can refer THEOREM 3.9 of Guide to Pairing-based Cryptography.

那么Weil Reciprocity 究竟有什么意义呢? 它直接诞生了 Weil Pairing.

Weil Pairing

定义

假定在 $r$ -torsion subgroup 中有两个线性不相交的点, $P, Q \in E [r], P \neq = λ Q$ . 基于此，假定 $(f) = r \cdot D_{P}$ , and $D_{P} \equiv (P) - (O)$ , 同样 $(g) = r \cdot D_{Q}, D_{Q} \equiv (Q) - (O)$ . 它们同样满足 $S u pp (D_{P}) \land S u pp (D_{Q}) = \emptyset$ .

然后我们就有: $g_{r D_{Q}} (r \cdot D_{P}) g_{r D_{Q}} (D_{P})^{r} (\frac{g _{r D_{Q}} ( D _{P} )}{f _{r D_{P}} ( D _{Q} )})^{r} \equiv f_{r D_{P}} (r \cdot D_{Q}) ⇓ \equiv f_{r D_{P}} (D_{Q})^{r} ⇓ \equiv 1$

这样，Weil Pairing 就出现了: $\frac{f _{r D_{Q}} ( D _{P} )}{f _{r D_{P}} ( D _{Q} )} = μ_{r} \in F_{p^{k}}^{\times} [r]$ 其中 $(f_{r D_{Q}}) = r D_{Q}, (f_{r D_{P}}) = r D_{P}$ , $μ_{r}$ 是乘法group $F_{p^{k}}^{\times}$ 上的 $r$ -次单位元根 , 也就是说 $μ_{r}^{r} \equiv 1 mod p^{k} - 1$ .

如何选择合适的divisor $D_{P}$ and $D_{Q}$

理论上我们需要选择合适的 divisors $D_{P}$ and $D_{Q}$ ，让它们的support 不相交, 你可能会奇怪，这应该有很多种选择，那么 $D_{P}$ and $D_{Q}$ 不同的选择会导致最终pairing的结果 $μ_{r}$ 不一样吗？

事实上 Weil Pairing 的结果 $μ_{r}$ 它是与 $D_{P}$ and $D_{Q}$ 的选择无关的。下面简单证明一下：

假定 $D_{P 1}$ and $D_{P 2}$ 都是与divisor $(P) - (O)$ 等效的divisor, 那么一定存在另外一个中间divisor $(t)$ 使得 $D_{P 1} = D_{P 2} + (t)$ , 然后: $\frac{f _{r D_{Q}} ( D _{P 1} )}{f _{r D_{P 1}} ( D _{Q} )} = \frac{f _{r D_{Q}} ( D _{P 2} ) \cdot f _{r D_{Q}} (( t ))}{f _{r D_{P 2}} ( D _{Q} ) \cdot f _{(t)} ( D _{Q} ) ^{r}}$

根据 Weil Reciprocity 定理, 由于 $s u pp ((t)) \land s u pp (r D_{Q}) = \emptyset$ , 所以 $f_{r D_{Q}} ((t)) \equiv f_{(t)} (r D_{Q}) = f_{(t)} (D_{Q})^{r}$ . 因此: $\frac{f _{r D_{Q}} ( D _{P 1} )}{f _{r D_{P 1}} ( D _{Q} )} = \frac{f _{r D_{Q}} ( D _{P 2} )}{f _{r D_{P 2}} ( D _{Q} )}$

既然跟divisor 具体的选择无关，那我们就选择最简单的 divisors： $D_{P} = (P) - (O), D_{Q} = (Q) - (O)$ . 这时，它们的support 是存在交集的，根据上面那个general Weil Reciprocity公式，我们就有Weil Pairing的正式定义: $(- 1)^{r} \cdot \frac{f _{r ((Q) - (O))} (( P ) - ( O ))}{f _{r ((P) - (O))} (( Q ) - ( O ))} = μ_{r} \in F_{p^{k}}^{\times} [r]$

如何对divisor $D_{P}$ and $D_{Q}$ 进行evaluate

divisor $D_{P} = (P) - (O)$ 的evaluation 可以被进行一步简化:

$f_{r D_{Q}} (D_{P}) \equiv f_{r D_{Q}} (P)$

只要 $P$ and $Q$ 是线性不相关的，即 $P \neq = λ Q, λ \leq r$ .

注意上面的符号是 $\equiv$ 不是 $=$ ，也就是说它们evaluation的值可能不同，但并不会对Weil Pairing 最终的结果 $μ_{r}$ 有影响，即： $\frac{f _{r D_{Q}} ( P )}{f _{r D_{P}} ( Q )} = \frac{f _{r D_{Q}} ( D _{P} )}{f _{r D_{P}} ( D _{Q} )} = μ_{r}$

因此 Weil Pairing 简化为: $(- 1)^{r} \cdot \frac{f _{r ((Q) - (O))} ( P )}{f _{r ((P) - (O))} ( Q )} = μ_{r} \in F_{p^{k}}^{\times} [r]$

Miller Loop 使得divisor function的evaluation $f_{r ((Q) - (O))} (P)$ 变得更容易实现，是工程上的一大步。很明显 Weil Pairing 是几何上对称的, 它实际上需要运行两次 Miller Loop. 看起来并不太经济? 实际上单次就够了，这就是 Tate Pairing 要做的事情.

算法

直接参考Guide to Pairing-based Cryptography 中的Algorithm 3.2:

algorithm3.2

Tate Pairing

你可能会奇怪divisor function的evaluation $f_{r ((P) - (O))} (Q)$ 长什么样子? 由于 $P, Q \in E_{F_{p^{k}}} [r]$ , 然后 $P_{x}, P_{y}, Q_{x}, Q_{y} \in F_{p^{k}}$ , 所以 $f_{r ((P) - (O))} (Q) \in F_{p^{k}}$ . 运用coset 的特性, Tate Pairing 就出现了: $f_{r ((P) - (O))} (Q)^{\frac{p ^{k} - 1}{r}} \equiv μ_{r} \in F_{p^{k}}^{\times} [r]$

它分两步走, Miller Loop 和 Final Exponentiation. 这也是我们所说的 Final Exponentiation 的由来。

定义

其实 Tate Pairing 有一个更正式的定义: $e_{T, r} (P, Q) : E [r] (F_{p^{k}}) \times E (F_{p^{k}}) / r E (F_{p^{k}}) \to μ_{r}$ 其中 $P \in E [r] (F_{p^{k}}), Q \in E (F_{p^{k}}) / r E (F_{p^{k}})$ , $Q$ 并不是 $r$ -torsion subgroup 中的元素, 它不再跟 $P$ 一样被定义在group $E (F_{p^{k}}) [r] 上$ 。而是商群的某个元素, 确切的说就是group $E (F_{p^{k}})$ 上的任意一个与 $P$ 线性不相关的元素. 看起来似乎是把约束条件放得更宽了。

既然这样，那么divisor function的evaluation值 $f_{r, P} (Q)$ (result of Miller Loop)会变成什么样子呢? 同样，它一定也是商群的某个元素，确切的说就是group $F_{p^{k}}^{\times}$ 上的任意一个元素，这也更加坚定了后续提指Final Expoentiation的必要性:

$f_{r, P} (Q) \in F_{p^{k}}^{\times} / r F_{p^{k}}^{\times}$

似乎Tate Pairing 要比Weil Pairing更通用 (more relaxed constraints) ，是吧?

Since $P \neq = λ Q, λ \leq r$ , usually for the convenience of computation(utilization of Frobenius Automorphism) we let $P \in G_{1} = π [1]$ , namely $π (P) = 1 \cdot P$ , $G_{1}$ is so-called Base Group. While $Q \in G_{2} = π [p]$ , namely $π (Q) = [p] Q$ , $G_{2}$ is so-called Trace-zero Group. :::

算法

同样直接参考 Guide to Pairing-based Cryptography 的Algorithm 3.3:

algorithm3.3

Miller Loop

你可能已经注意到， Weil Pairing 中Miller Loop 的长度 and Tate Pairing 的都是 $lo g (r)$ (bit length of $r$ ).

理论上 Tate Pairing 已经够实用了，至少实现起来是没有任何阻碍的了，所以后续的research 其实主要是针对工程实现上的优化，基本框架并没有改变。基本集中在缩短 Miller Loop 的长度，以及更高效的提指 Final Expoentiation运算.

还有Miller Loop 更短的算法? 是的，但是我们需要深入挖掘一下乘法group $F_{p^{k}}^{\times}$ 的结构.

Ate Pairing

在Ate Pairing中, 点 $Q$ 被严格约束在 $G_{2} = π [p]$ 中，同时点 $P$ 也被约束在 $G_{1} = π [1]$ 中，即Frobenius Map： $π (Q) = [p] Q, π (P) = [1] P$ 充分利用Frobenius Map的特性，将大大降低pairing的计算成本。

Miller 算法的两个重要特性

$f_{a + b}, Q (P) f_{a \cdot b, Q} (P) = f_{a, Q} (P) \cdot f_{b, Q} (P) \cdot \frac{l _{[a] Q, [b] Q}}{v _{[a + b] Q}} = f_{b, Q}^{a} (P) \cdot f_{a, [b] Q} (P)$ 关于这两个特性的proof，这里不再推演，熟悉divisor function 后很容易推导出来。

更短的 Miller Loop

由于 $r ∣ p^{k} - 1$ , 假定 $u = (p^{k} - 1) // r$ ，因此我们就有: $f_{p^{k}, Q} (P) = f_{p^{k} - 1, Q} (P) \cdot f_{1, Q} (P) \cdot \frac{l _{[p^{k} - 1] Q, [1] Q} ( P )}{v _{[p^{k} - 1 + 1] Q} ( P )}$

由于 $Q \in G_{2}$ , 然后 $[r] Q = O, [p^{k} - 1] Q = O$ , 我们就有 $l_{[p^{k} - 1] Q, [1] Q} = v_{[p^{k} - 1 + 1] Q} = (Q) + (- Q) - 2 (O)$ , 因此: $f_{p^{k}, Q} (P) = f_{p^{k} - 1, Q} (P) = f_{r, Q} (P)^{u}$

看起来我们似乎可以用 $p$ 替代 $r$ 了, 但是这完全没有必要，因为 $p > r$ ，反而让Miller Loop 变得更长了。

如果 $λ \equiv p mod r$ and $r ∣ p^{k} - 1$ , 然后 $r ∣ λ^{k} - 1$ , 假定 $m = (λ^{k} - 1) // r$ , 类似地我们有: $f_{λ^{k}, Q} (P) = f_{λ^{k} - 1, Q} (P) = f_{r, Q} (P)^{m}$

根据上面的两个 Miller 算法的特性，可以继续推导: $f_{λ^{k}, Q} = f_{λ, Q}^{λ^{k - 1}} \cdot f_{λ^{k - 1}, [λ] Q} = f_{λ, Q}^{λ^{k - 1}} \cdot f_{λ, [λ] Q}^{λ^{k - 2}} \cdot f_{λ^{k - 2}, [λ^{2}] Q} = f_{λ, Q}^{λ^{k - 1}} \cdot f_{λ, [λ] Q}^{λ^{k - 2}} \cdot f_{λ, [λ^{2}] Q}^{λ^{k - 3}} \cdot f_{λ^{k - 3}, [λ^{3}] Q} = \dots = f_{λ, Q}^{λ^{k - 1}} \cdot f_{λ, Q}^{λ^{k - 2} \cdot p} \cdot f_{λ, Q}^{λ^{k - 3} \cdot p^{2}} \cdot \dots \cdot f_{λ, Q}^{1 \cdot p^{k - 1}} = f_{λ, Q}^{\sum_{i = 0}^{k - 1} (k - 1 - i) \cdot p^{i}}$ 令 $c = \sum_{i = 0}^{k - 1} (k - 1 - i) \cdot p^{i}$ , 我们有: $f_{λ^{k}, Q} (P) = f_{λ, Q} (P)^{c} = f_{r, Q} (P)^{m}$

由于 $λ < r$ , 我们完全可以用 $λ$ 替换 $r$ , 但是如何找到这个 $λ$ 值呢?

Trace of Frobenius

根据 Hesse Bound 定理，我们有: $∣ p + 1 - t ∣ = # E (F_{p})$ 令 $T = t - 1$ 其中 $t$ 就是我们据说的Trace of Frobenius, 由于 $r ∣# E (F_{p})$ , 然后 $λ = T \equiv p mod r$ .

最后我们得到: $a_{T} (P, Q) (f_{T, Q} (P)^{c})^{\frac{p ^{k} - 1}{r}} ⇓ a_{T} (P, Q)^{c} = f_{T, Q} (P)^{\frac{p ^{k} - 1}{r}} = (f_{r, Q} (P)^{m})^{\frac{p ^{k} - 1}{r}} = e_{T, r} (P, Q)^{m}$

很明显 Tate Pairing $e_{T, r} (P, Q)$ 和 Ate Pairing $a_{T} (P, Q)$ 有着非常紧密的关系。你可能已经注意到，这两个pairing的计算结果 $μ_{r}$ 很可能不相等，不用紧张，只是pairing策略的差异而已，并不影响它在乘法group $F_{p^{12}}^{\times} [r]$ 中的唯一性，这才是pairing 的最终目的。

事实上Ate Pairing 在做的就是找到与 $r$ 的某个倍乘相关的数, $T$ 就是我们要找的,它满足 $r ∣ T^{k} - 1$ . 但是， $lo g T$ 一定是最短的 Miller Loop吗? 可能是（也可能不是），下面写几行代码反证一下：

p = 103
r = 7
k = 6

for i in range(1, k):
    print('lambda[{0}] = {1}'.format(i, (p ** i) % r))

运行结果：

lambda[1] = 5
lambda[2] = 4
lambda[3] = 6
lambda[4] = 2
lambda[5] = 3

很明显 $λ_{1} \equiv p^{1} mod r$ ，并不是最小的， $λ_{4} \equiv p^{4} mod r$ 才是。

Optimal Ate Pairing

optimal ate

在上面的 Ate Pairing 中, 我们直接地用 $p$ 替换 $T$ 后得到: $f_{p, Q}^{x 2} = f_{r, Q}^{u}$ 其中 $u = (p^{k} - 1) // r$ , and $x 2 = k \cdot p^{k - 1}$ .

在 Ate Pairing 中，我们有: $f_{λ, Q}^{x 1} = f_{r, Q}^{m}$ 其中 $m = (λ^{k} - 1) // r$ , and $x 1 = \sum_{i = 0}^{k - 1} (k - 1 - i) \cdot p^{i}$ .

基于此，我们可以找到二者之间的联系: $f_{p, Q}^{x 2 \cdot m} ⟹ f_{λ, Q}^{x 1} = f_{T, Q}^{x 1 \cdot u} = f_{p, Q}^{\frac{x 2 \cdot m}{u}} = f_{p, Q}^{\frac{k \cdot p ^{k - 1} \cdot m}{( p ^{k} - 1 ) // r}}$

因此，Ate Pairing 经过 $x 1$ 次方提指后变成: $a_{λ} (P, Q)^{x 1} = (f_{λ, Q} (P)^{x 1})^{\frac{p ^{k} - 1}{r}} = (f_{p, Q} (P)^{\frac{k \cdot p ^{k - 1} \cdot m}{( p ^{k} - 1 ) // r}})^{\frac{p ^{k} - 1}{r}}$ 暂时先把结论放这儿.

在Optimal Ate Pairing中把 $λ$ 进行了更通用的定义： $λ = \sum_{i = 0}^{l} c_{i} \cdot p^{i}, l < k$ , and $λ = m \cdot r$ . 同样运用上面的 Miller 算法的特性, 我们把它的divisor function 进行展开:

$f_{λ, Q} = f_{\sum_{i = 0}^{l} c_{i} \cdot p^{i}, Q} = i = 0 \prod l f_{c_{i} \cdot p^{i}, Q} \cdot j = 0 \prod l - 1 \frac{l _{[s_{j + 1}] Q, [c_{j} \cdot q^{j}] Q}}{v _{[s_{j}] Q}} = i = 0 \prod l f_{p^{i}, Q}^{c_{i}} \cdot (i = 0 \prod l f_{c_{i}, Q}^{p^{i}} \cdot j = 0 \prod l - 1 \frac{l _{[s_{j + 1}] Q, [c_{j} \cdot q^{j}] Q}}{v _{[s_{j}] Q}})$ 其中: $i = 0 \prod l f_{p^{i}, Q}^{c_{i}} = i = 0 \prod l f_{p, Q}^{i \cdot c_{i} \cdot p^{i - 1}} = f_{p, Q}^{\sum_{i = 0}^{l} i \cdot c_{i} \cdot p^{i - 1}}$

然后 Ate Pairing 就被转换成了: $a_{λ} (P, Q) = f_{λ, Q} (P)^{\frac{p ^{k} - 1}{r}} = (f_{p, Q} (P)^{\sum_{i = 0}^{l} i \cdot c_{i} \cdot p^{i - 1}})^{\frac{p ^{k} - 1}{r}} \cdot (i = 0 \prod l f_{c_{i}, Q} (P)^{p^{i}} \cdot j = 0 \prod l - 1 \frac{l _{[s_{j + 1}] Q, [c_{j} \cdot q^{j}] Q} ( P )}{v _{[s_{j}] Q} ( P )})^{\frac{p ^{k} - 1}{r}} = (f_{p, Q} (P)^{\frac{k \cdot p ^{k - 1} \cdot m}{( p ^{k} - 1 ) // r}})^{\frac{p ^{k} - 1}{r}}$

很明显 Ate Pairing $a_{λ} (P, Q)$ 被划分成了两部分, 左边部分 $(f_{p, Q}^{\sum_{i = 0}^{l} i \cdot c_{i} \cdot p^{i - 1}})^{\frac{p ^{k} - 1}{r}}$ 是基于 $p$ 的 Ate Pairing (length of Miller Loop is $lo g p$ )。

既然左边已经是一个Ate Pairing 了，那么右边部分 $(\prod_{i = 0}^{l} f_{c_{i}, Q}^{p^{i}} \cdot \prod_{j = 0}^{l - 1} \frac{l _{[s_{j + 1}] Q, [c_{j} \cdot q^{j}] Q}}{v _{[s_{j}] Q}})^{\frac{p ^{k} - 1}{r}}$ 肯定也是一个Ate Pairing，只要 $\frac{k \cdot p ^{k - 1} \cdot m}{( p ^{k} - 1 ) // r} \neq = \sum_{i = 0}^{l} i \cdot c_{i} \cdot p^{i - 1}$ **。

所以Optimal Ate Pairing 正式定义就来了: $a_{[c_{0}, c_{1}, \dots, c_{l}]} (P, Q) = (i = 0 \prod l f_{c_{i}, Q} (P)^{p^{i}} \cdot j = 0 \prod l - 1 \frac{l _{[s_{j + 1}] Q, [c_{j} \cdot q^{j}] Q} ( P )}{v _{[s_{j}] Q} ( P )})^{\frac{p ^{k} - 1}{r}}$ 其中系数 $c_{i}$ 都是尽可能小的数.

不用担心指数运算 $p^{i}$ , 它几乎是免费的，在充分运用 Frobenius Map后. Optimal Ate Pairing 要做的就是并行计算 $f_{c_{i}, Q} (P)$ and $l_{[s_{j + 1}] Q, [c_{j} \cdot q^{j}] Q} (P)$ , 此时Miller Loop 的长度可能就是 $ma x (lo g c_{i})$ .

可以如何找到这么一组系数 $c_{i}$ 呢? 实际上它是一个关于 Lattice 的问题，感兴趣可以继续研究 Optimal Pairings.

有限域上的算术运算

BLS12-381 曲线的定义是这样的: $E (F_{p^{12}}) : y^{2} = x^{3} + 4$ 其中 $F_{p^{12}} = F_{p} [v] / X^{12} - 2 X^{6} + 2$ 。但是这个extension field 是如何构建的呢？

Pairing 中域的切换

为了对Pairing 底层的算术运算有个更直观的sense，下面简单介绍一下Tate/Ate pairings中域的切换。

假定定义在域 $F_{p}$ 上的点 $P \in G_{1}$ ，同时点 $Q \in G_{2}$ 定义在域 $F_{p^{12}}$ 上，实际上点 $Q$ 的坐标必须定义在域 $F_{p^{12}}$ 的某个子域上 (先给出结论，后续有推理过程)，比如说 $x_{Q} \in F_{p^{6}}, x_{P} \in F_{p}$ 。整个过程，可以切分为4个部分：

Miller Loop
- Double-Add
  
  line function $f_{r, P}$ 不会改变所在的域， $P$ 在哪个域，这个函数仍然在那个域，比如 $F_{p}$ :
- Evaluation Line Function
  
  比如，单个line function的evaluation： $l_{r, P} (Q) = y_{Q} - y_{T} - α \cdot (x_{Q} - x_{T})$
  
  最终evaluation 的结果， $f_{r, P} (Q)$ 不再定义在 $Q$ 原本的域 $[r] F_{p^{12}}^{\times}$ 上了.
Final Exponentiation
- Easy Part
  
  通过提指把Mill Loop 的结果 $f_{r, P} (Q)$ 推进一个特殊的乘法group，这就是我们所说的 Cyclotomic Group， $F_{Φ_{12}}$ :
- Hard Part
  
  再次通过提指从Cyclotomic Group 拉到目标乘法group $F_{p^{12}}^{\times} [r]$ :

域塔 Tower Fields

定义

大家知道BLS12-381 Pairing中的目标group $G_{T}$ 是一个定义在 $F_{p^{12}}$ 上的 $r$ -torsion multiplicative subgroup，我们经常表示为 $F_{p^{12}}^{\times} [r]$ 。

那么 $F_{p^{12}}$ 是如何被构造出来的呢? 这就是tower fields 的由来：

$F_{p} [u] X^{2} - α F_{p^{2}} [v] X^{3} - β F_{p^{6}} [w] X^{2} - γ F_{p^{12}}$

在BLS12-381曲线上，extension field modulus的常量分别为: $α β γ = - 1 \in F_{p} = u + 1 = α + 1 = - 1 + 1 \in F_{p^{2}} = v = 3 β = 3 u + 1 = 3 α + 1 = 3 - 1 + 1 \in F_{p^{6}}$

$F_{p^{12}}$ 模的由来：

$X^{2} - γ = X^{2} - v$ is irreducible in $F_{p^{6}}$

since $v$ is one root of $X^{3} - β$ , then we have $X^{6} - β$ is irreducible in $F_{p^{2}}$

since $β - 1$ is one root of $X^{2} - α$ , then we have $(X^{6} - 1)^{2} - α = X^{12} - 2 X^{6} + 2$ is irreducible in $F_{p}$

therefore we have $F_{p^{12}} = F_{p} [v] / X^{12} - 2 X^{6} + 2$

也就是说，域 $F_{p^{12}}$ 上的算术运算可以通过域 $F_{p^{6}}$ 上的算术运算来完成，同时域 $F_{p^{6}}$ 的算术运算可以通过域 $F_{p^{2}}$ 上的算术运算来完成，同样域 $F_{p^{2}}$ 的算术运算可以通过base prime field $F_{p}$ 上的算术运算来完成。这就是我们据说的域塔 tower fields。

你可能已经注意到域的拓展 $F_{p} ⟶ F_{p^{2}}$ 和 $F_{p^{6}} ⟶ F_{p^{12}}$ 都是二次拓展 quadratic extension, 而 $F_{p^{2}} ⟶ F_{p^{6}}$ 是三次拓展 cubic extension。所以 quadratic extension 和 cubic extension 在高阶extension field （比如 $F_{p^{12}}, F_{p^{24}}$ ）的算术运算中扮演着非常重要的角色。

Quadratic Extension 上的算术运算

这部分属于常规的计算逻辑，可以直接参考 Guide to Pairing-based Cryptography 5.2.1 章节。

Cubic Extension 上的算术运算

同样，这部分也可以直接参考 Guide to Pairing-based Cryptography 5.2.2 章节。

Cyclotomic Group 上的算术运算

分圆群 Cyclotomic group 在Pairing 的提指运算 Final Expoentiation 扮演着最核心的角色，特别是在 Tate/Ate Pairings中。既然是提指，那么主要就是平方 squaring 和指数 exponentiation 这两个算子。下面主要推演一下squaring 的全过程。

假定 $α \in F_{p^{3}}, p = q^{2}$ ， $F_{q}$ 表示base prime field，那么如何计算 $α^{2}$ ?

首先，我们需要利用tower fields来表示 $α$ ，比如： $F_{p^{3}} F_{q^{2}} = F_{(q^{2})^{3}} = F_{q^{2}} [v] / v^{3} - u = F_{q} [u] / u^{2} - ξ$

假定 : $α = a + b \cdot v + c \cdot v^{2}$ 则: $α^{2} = (a + b v + c v^{2})^{2} = a^{2} + b^{2} v^{2} + c^{2} v^{4} + 2 (a \cdot b v + a \cdot c v^{2} + b v \cdot c v^{2})$

由于 $v^{3} - u = 0$ ，我们继续推进: $α^{2} = (a^{2} + 2 b c \cdot u) + (c^{2} \cdot u + 2 ab) \cdot v + (b^{2} + 2 a c) \cdot v^{2} = A + B \cdot v + C \cdot v^{2}$

所以最终我们会有3次域 $F_{q^{2}}$ 上的squaring (分别是 $a^{2}, b^{2}, c^{2}$ )，和5次域 $F_{q^{2}}$ 上的multiplication (分别是 $a \cdot b, b \cdot c, a \cdot c, b c \cdot u, c^{2} \cdot u$ )。

域 $F_{q^{2}}$ 上的乘法运算可能会比较昂贵，那么有没有改进的方法呢? YES

Squaring Friendly Field

如果 $6∣ n$ , 而且 $p$ 是一个非常大的素数characteristic，乘法group $F_{p^{n}}^{\times}$ 的阶 $p^{n} - 1$ 可以用多个cyclotomic polymomials $Φ_{i}$ 的连乘来表示: $p^{n} - 1 = i = 1 \prod i ∣ n Φ_{i} (p)$

这里我们称 $F_{p^{n}}$ 为 Squaring Friendly Field.

举个例子乘法group $F_{p^{12}}^{\times}$ : $p^{12} - 1 = Φ_{1} (p) \cdot Φ_{2} (p) \cdot Φ_{3} (p) \cdot Φ_{4} (p) \cdot Φ_{6} (p) \cdot Φ_{12} (p)$

其中: $Φ_{1} (p) Φ_{2} (p) Φ_{3} (p) Φ_{4} (p) Φ_{6} (p) Φ_{12} (p) = p - 1 = p + 1 = (p - ζ_{3}^{1}) \cdot (p - ζ_{3}^{2}) = p^{2} + p + 1, ζ_{3}^{3} = 1 = (p - ζ_{4}^{1}) \cdot (p - ζ_{4}^{3}) = p^{2} + 1, ζ_{4}^{4} = 1 = (p - ζ_{6}^{1}) \cdot (p - ζ_{6}^{5}) = p^{2} - p + 1, ζ_{6}^{6} = 1 = (p - ζ_{12}^{1}) \cdot (p - ζ_{12}^{5}) \cdot (p - ζ_{12}^{7}) \cdot (p - ζ_{12}^{11}) = p^{4} - p^{2} + 1, ζ_{12}^{12} = 1$

换句话说，乘法group $F_{p^{12}}^{\times}$ 的阶可以被因子分解成： $∣ F_{p^{12}}^{\times} ∣ = p^{12} - 1 = (p - 1) \cdot (p + 1) \cdot (p^{2} + p + 1) \cdot (p^{2} + 1) \cdot (p^{2} - p + 1) \cdot (p^{4} - p^{2} + 1)$

所以乘法group $F_{p^{12}}^{\times}$ 中一定存在一个阶为 $r = p^{4} - p^{2} + 1$ 的subgroup $G_{Φ_{12} (p)}$ 。

因此，我们得到一个非常重要的结论: $α \in G_{Φ_{12} (p)} \subset F_{p^{12}}^{\times} ⇓ α^{Φ_{12} (p)} = α^{p^{4} - p^{2} + 1} = 1$

更快的 Squaring 算子

回到上面的Squaring 运算，有 $α \in F_{(q^{2})^{3}} = F_{q^{2}} [v] / v^{3} - u$ : $α = a + b \cdot v + c \cdot v^{2}, {a, b, c} \in F_{q^{2}}$

Squaring 之后: $α^{2} = (a^{2} + 2 b c \cdot u) + (c^{2} \cdot u + 2 ab) \cdot v + (b^{2} + 2 a c) \cdot v^{2} = A + B \cdot v + C \cdot v^{2}$

现在的问题是如何有效地计算 ${a \cdot b, b \cdot c, a \cdot c}$ ?

在Tate/Ate Pairing的Final Exponentiation中 $α \in G_{Φ_{6} (q)}$ ，根据上面刚刚推演出的结论: $α^{Φ_{6} (q)} = α^{q^{2} - q + 1} = 1 ⟹ α^{q^{2}} \cdot α = α^{q}$

其中: $α^{q} = (a + b \cdot v + c \cdot v^{2})^{q} = a^{q} + b^{q} \cdot v^{q} + c^{q} \cdot (v^{q})^{2}$

但是如何有效地计算诸如 $a^{q}, b^{q}, c^{q}, v^{q}, v^{2 q}$ ? 我们拆开来看:

$a^{q}, b^{q}, c^{q} = ?$

根据Frobenius Map 的特性，我们很容易得到： $a^{q} = \overset{a}{ˉ}, b^{q} = \overset{ˉ}{b}, c^{q} = \overset{c}{ˉ}$ (先给出结论，在后面Frobenius Map 部分会进行推理)。因此上面的式子简化成: $α^{q} = \overset{a}{ˉ} + \overset{ˉ}{b} \cdot v^{q} + \overset{c}{ˉ} \cdot (v^{q})^{2}$
$v^{q} = ?$

由于 $v^{3} = u, u^{2} = ξ, u \in F_{q^{2}}, ξ \in F_{q}$ ，因此： $v^{q} = v^{3 \cdot (q - 1) /3} \cdot v = u^{\frac{q - 1}{3}} \cdot v = ξ^{\frac{q - 1}{6}} \cdot v = ζ_{6} \cdot v$ 其中 $ζ_{6}$ 是域 $F_{q}$ 上的 primitive 6-th root of unity，也就是说 $ξ_{6}^{6} \equiv 1 mod q$ .

More properties of primitive 6-th root of unity in $F_{q}$ : $1 + ζ_{6}^{2} = ζ_{6}$ $ζ_{6}^{2} + ζ_{6}^{4} = - 1$ $ζ_{6}^{4} + ζ_{6} = 0$

综合在一起，我们得到: $α^{q} = \overset{a}{ˉ} + (\overset{ˉ}{b} \cdot ζ_{6}) \cdot v + (\overset{c}{ˉ} \cdot ζ_{6}^{2}) \cdot v^{2}$

应用Frobenius map 后: $α^{q^{2}} = \overset{a}{ˉ}^{q} + (\overset{ˉ}{b}^{q} \cdot ζ_{6}^{q}) \cdot v^{q} + (\overset{c}{ˉ}^{q} \cdot ζ_{6}^{2 q}) \cdot v^{2 q} = a + (b \cdot ζ_{6}^{q + 1}) \cdot v + (c \cdot ζ_{6}^{2 q + 2}) \cdot v^{2} = a + (b \cdot ζ_{6}^{2}) \cdot v + (c \cdot ζ_{6}^{4}) \cdot v^{2}$

应用Squaring Friendly Field的特性，我们得到： $α^{q^{2}} \cdot α = α^{q} ⇕ (a + (b \cdot ζ_{6}^{2}) \cdot v + (c \cdot ζ_{6}^{4}) \cdot v^{2}) \cdot (a + b \cdot v + c \cdot v^{2}) = \overset{a}{ˉ} + (\overset{ˉ}{b} \cdot ζ_{6}) \cdot v + (\overset{c}{ˉ} \cdot ζ_{6}^{2}) \cdot v^{2}$

展开后，得到: $\overset{a}{ˉ} \overset{ˉ}{b} \cdot ζ_{6} \overset{c}{ˉ} \cdot ζ_{6}^{2} = (a^{2} + b c ζ_{6}^{2} \cdot u + b c ζ_{6}^{4} \cdot u) = (ab + ab ζ_{6}^{2} + c^{2} ζ_{6}^{4} \cdot u) = (a c + a c ζ_{6}^{4} + b^{2} ζ_{6}^{2})$

所以上面的三个乘法运算被转换成: $b \cdot c a \cdot b a \cdot c = \frac{a ˉ - a ^{2}}{( ζ _{6}^{2} + ζ _{6}^{4} ) \cdot u} = \frac{a ˉ - a ^{2}}{- u} = \frac{( b ˉ + c ^{2} \cdot u ) \cdot ζ _{6}}{1 + ζ _{6}^{2}} = \frac{( b ˉ + c ^{2} \cdot u ) \cdot ζ _{6}}{ζ _{6}} = c^{2} \cdot u + \overset{ˉ}{b} = \frac{( c ˉ - b ^{2} ) \cdot ζ _{6}^{2}}{1 + ζ _{6}^{4}} = \frac{( c ˉ - b ^{2} ) \cdot ζ _{6}^{2}}{- ζ _{6}^{2}} = b^{2} - \overset{c}{ˉ}$

最终: $A B C ⟹ α^{2} = a^{2} + 2 b c \cdot u = 3 a^{2} - 2 \overset{a}{ˉ} = c^{2} \cdot u + 2 ab = 3 c^{2} \cdot u + 2 \overset{ˉ}{b} = b^{2} + 2 a c = 3 b^{2} - 2 \overset{c}{ˉ} = (3 a^{2} - \overset{a}{ˉ}) + (3 c^{2} \cdot u - 2 \overset{ˉ}{b}) \cdot v + (3 b^{2} - 2 \overset{c}{ˉ}) \cdot v^{2}$

域 $F_{q^{2}}$ 上的5个乘法，只剩下1个乘法，共轭 $\overset{a}{ˉ}, \overset{ˉ}{b}, \overset{c}{ˉ}$ 完全免费。

Twist 的力量

为什么要twist

尽管我们通过tower fields 来表示 $F_{p^{12}}$ ，不幸的是 $F_{p^{12}}$ 仍然有点儿贵，尤其应用在链上或者微型终端设备上。所以我们可以简单地把twist 当作pairing实现层面的一种高级的trick来看待。

我们可以通过sextic-twist(twist degree 是 6) 把高阶域 $F_{p^{12}}$ 上的元素映射到低阶域 $F_{p^{2}}$ : $φ : F_{p^{12}} ⟼ F_{p^{2}}$ 但是如何做呢?

Sextic Twist

一个定义在高阶extension field $F_{p^{12}}$ 上的椭圆曲线 $E_{12}$ : $E_{12} : y^{2} = x^{3} + b$

另一个定义在低阶extension field $F_{p^{2}}$ 上的twisted 椭圆曲线 $E_{2}^{'}$ ，它与 $E_{12}$ 有着twist isomorphism关系： $E_{2}^{'} : y^{'2} = x^{'3} + b \cdot ξ$ 其中 $ξ \in F_{p^{2}}$ ， $ξ$ is both non-quadratic and non-cubic residual, 也就是说: $ξ \in F_{p^{4}}, 3 ξ \in F_{p^{6}}$

因此: $6 ξ = w \in F_{p^{12}}$

但是如何选择一个合适的 $ξ$ 呢? 似乎 $ξ$ 刚好把域 $F_{p^{2}}$ 拓展到了 $F_{p^{12}}$ 。幸运的是，刚好 $β$ 就是这么一个数。

According to above tower fields, we can easily have: $> F_{p^{2}} [x] X^{6} - β F_{p^{12}} >$

所以这个twisted 的椭圆曲线就是 :-1: : $E_{2}^{'} : y^{'2} = x^{'3} + b \cdot β$

这就是我们想要的 $G_{2}$ 吗？ $β$ 一定是我们要找的twist参数吗？

不一定，原本 $G_{2}$ 是定义在 $F_{p^{12}}$ 上的，也就是上面的 $E (F_{p^{12}})$ 的subgroup $E (F_{p^{12}}) [r]$ ，但是 $F_{p^{12}}$ 上的运算成本较高，所以想通过twist 的方式把 $E (F_{p^{12}}) [r]$ 上的点一一映射到 $E^{'} (F_{p^{2}}) [r]$ ，这样运算成本会大大降低。但是，可能会存在: $∣ E_{2}^{'} ∣ mod r \neq = 0$ 也就是说 $r$ 可能不能整除 $∣ E_{2}^{'} ∣$ ，曲线 $E_{2}^{'}$ 上可能不存在一个 $r$ -torsion subgroup。这是不满足我们一一映射的目的: $φ : E (F_{p^{12}}) ⟼ E (F_{p^{2}})^{'}$ 所以我们在选择twist 参数里要特别小心。那如何找到满足条件的twist 参数呢？其实这个参数只有两种可能性。

如果 $β$ 不合适，那么 $β^{5}$ 一定是那个合适的(论文也有提及)，大家也可以试一下，最终我们确定 $G_{2}$ 所在的曲线: $E_{2}^{'} : y^{'2} = x^{'3} + b \cdot ξ ⇕ E_{12} : (\frac{y ^{'}}{2 ξ})^{2} = (\frac{x ^{'}}{3 ξ})^{3} + b$ 其中 $ξ = β^{5} \in F_{p^{2}}$ 或者 $ξ = β \in F_{p^{2}}$ and $2 ξ \in F_{p^{4}}, 3 ξ \in F_{p^{6}}$ .

Sextic Twist Map

下面简单介绍一下两group $E_{12}$ and $E_{2}^{'}$ 元素之间的映射关系：

Twist Operation

把 $E_{12}$ 上的元素映射到 $E_{2}^{'}$ 上: $φ : (x, y) ⟼ (x \cdot 3 ξ, y \cdot 2 ξ)$
Untwist Operation

把 $E_{2}^{'}$ 上的元素映射到 $E_{12}$ 上: $φ^{- 1} : (x^{'}, y^{'}) ⟼ (\frac{x ^{'}}{3 ξ}, \frac{y ^{'}}{2 ξ})$

twist/untwist的过程是很便宜的，尤其是当我们把期间用到的常量 $2 ξ, 3 ξ$ 预先算出来。最后明确一下，既然要用twist trick，那么将尽可能把运算都限制在低阶的域上，只是在必要的时候才通过untwist 把值转换到高阶域上。

Frobenius Map 的力量

同twist 一样，Frobenius Map 同样是pairing 实现层面的高级trick。它在extension field的运算过程中扮演着非常重要的角色，特别是Tate/Ate Pairings 中的提指Final Expoentiation。

下面我们粗略感受一下它分别在extension field $F_{p^{2}}, F_{p^{6}}, F_{p^{12}}$ 上有哪些特性：

Frobenius Map over $F_{p^{2}}$

假定: $F_{p^{2}} a = F_{p} [u] / X^{2} - α = (a_{0} + a_{1} u) \in F_{p^{2}}$

其中 $u^{2} = α = - 1$ and $a_{0}, a_{1} \in F_{p}$ , we have $a_{0}^{p} = a_{0}, a_{1}^{p} = a_{1}$ .

然后: $a^{p} = a_{0}^{p} + a_{1}^{p} \cdot u^{p} = a_{0} + a_{1} \cdot α^{(p - 1) /2} \cdot u$

由于 $(p - 1) /2$ 一定是个奇数，所以我们有: $a^{p} a^{p^{2}} \dots a^{p^{d}} = a_{0} - a_{1} \cdot u = a_{0} + a_{1} \cdot u = a_{0} + (- 1)^{d} a_{1} \cdot u$

结论： Frobenius Map $Φ_{d} (a) = a^{p^{d}} = a \in F_{p^{2}}$ 只要 $2∣ d$ .

Frobenius Map over $F_{p^{6}}$

假定: $F_{p^{6}} a = F_{p^{2}} [v] / X^{3} - β = (a_{0} + a_{1} v + a_{2} v^{2}) \in F_{p^{6}}$

其中 $v^{3} = β = u + 1$ and $β, a_{0}, a_{1}, a_{2} \in F_{p^{2}}$ , 我们有 $a_{0}^{p} = \overset{a}{ˉ}_{0}, a_{1}^{p} = \overset{a}{ˉ}_{1}, a_{2}^{p} = \overset{a}{ˉ}_{2}$ , and $v^{p} (v^{p})^{2} β \cdot \overset{ˉ}{β} = β^{(p - 1) /3} \cdot v = β^{2 \cdot \frac{p - 1}{3}} \cdot v^{2} = 1 - u^{2} = N_{2} (β) \in F_{p}$

然后: $a^{p} a^{p^{2}} \dots a^{p^{d}} = a_{0}^{p} + a_{1}^{p} \cdot v^{p} + a_{2}^{p} \cdot (v^{p})^{2} = \overset{a}{ˉ}_{0} + \overset{a}{ˉ}_{1} \cdot β^{(p - 1) /3} \cdot v + \overset{a}{ˉ}_{2} \cdot β^{2 \cdot \frac{p - 1}{3}} \cdot v^{2} = a_{0} + a_{1} \cdot \overset{ˉ}{β}^{(p - 1) /3} \cdot β^{(p - 1) /3} \cdot v + a_{2} \cdot \overset{ˉ}{β}^{2 \cdot \frac{p - 1}{3}} \cdot β^{2 \cdot \frac{p - 1}{3}} \cdot v^{2} = C_{d} (a_{0}) + C_{d} (a_{1}) \cdot N_{d} (β)^{\frac{p - 1}{3}} \cdot v + C_{d} (a_{2}) \cdot N_{d} (β)^{2 \cdot \frac{p - 1}{3}} \cdot v^{2}$ 其中 $C_{d} (a_{i})$ 表示在 $a_{i}$ 共轭 $d$ 次 , and $N_{d} (β)$ 表示在 $β$ 上norm $d$ 次.

两个方面需要考虑:

for $C_{d} (a_{i})$

We can easily have $C_{2} (a_{i}) = a_{i}, C_{4} (a_{i}) = a_{i}, C_{6} (a_{i}) = a_{i}$ .
for $N_{d} (β)$

Since $N_{2} (β) = (1 - u^{2}) \in F_{p}$ , then $N_{4} (β) = (1 - u^{2})^{2}, N_{6} (β) = (1 - u^{2})^{3} \in F_{p}$ , so we have: $a^{p^{6}} = C_{d} (a_{0}) + C_{d} (a_{1}) \cdot (1 - u^{2})^{p - 1} \cdot v + C_{d} (a_{2}) \cdot ((1 - u^{2})^{p - 1})^{2} \cdot v^{2} = a_{0} + a_{1} \cdot v + a_{2} \cdot v^{2} = a$

结论： $Φ_{d} (a) = a^{p^{d}} = a \in F_{p^{6}}$ 只要 $6∣ d$ .

Frobenius Map over $F_{p^{12}}$

假定: $F_{p^{12}} a = F_{p^{6}} [w] / X^{2} - v = (a_{0} + a_{1} w) \in F_{p^{12}}$

其中 $w^{2} = v, v^{3} = u + 1, u^{2} = - 1$ and $w, a_{0}, a_{1} \in F_{p^{6}}$ .

类似地, $a^{p} a^{p^{2}} \dots a^{p^{d}} = a_{0}^{p} + a_{1}^{p} \cdot w^{p} = Φ_{1} (a_{0}) + Φ_{1} (a_{1}) \cdot v^{(p - 1) /2} \cdot w = Φ_{2} (a_{0}) + Φ_{2} (a_{1}) \cdot (v^{p + 1})^{(p - 1) /2} \cdot w = Φ_{d} (a_{0}) + Φ_{d} (a_{1}) \cdot (v^{p^{d} + p^{d - 1} + \dots + 1})^{(p - 1) /2} \cdot w = Φ_{d} (a_{0}) + Φ_{d} (a_{1}) \cdot (v^{\frac{p ^{d} - 1}{p - 1}})^{(p - 1) /2} \cdot w = Φ_{d} (a_{0}) + Φ_{d} (a_{1}) \cdot v^{(p^{d} - 1) /2} \cdot w$

当 $d = 12$ , 由于 $6∣ d$ , 然后我们就有 $Φ_{d} (a_{i}) = a_{i}$ . 由于 $\frac{p ^{12} - 1}{2} = (p^{6} - 1) \cdot \frac{p ^{6} + 1}{2}$ , and $v \in F_{p^{6}}$ , 然后我们就有: $(v^{p^{6} - 1})^{\frac{p ^{6} + 1}{2}} = 1$

因此: $a^{p^{12}} = a_{0} + a_{1} \cdot w = a$

结论： $Φ_{d} (a) = a^{p^{d}} = a \in F_{p^{12}}$ 只要 $12∣ d$ .

Frobenius Map and Conjunction

有一个 quadratic extension: $F_{q^{2}} = F_{q} [u] / X^{2} - α$ 其中 $q = p^{m}$ , 假定 $a = a_{0} + a_{1} \cdot u \in F_{q^{2}} = F_{p^{2 m}}$ , 其中 $a_{0}, a_{1} \in F_{q} = F_{p^{m}}$ . 如果我们想要在 $a$ 上执行 $m$ 次 Frobenius Map: $a^{p^{m}} = a_{0}^{p^{m}} + a_{1}^{p^{m}} \cdot u^{p^{m}} = a_{0} + a_{1} \cdot α^{(p^{m} - 1) /2} \cdot u$ 由于 $α$ is non-quadratic residual, 也就是说 $α^{(p^{m} - 1) /2} = - 1$ , 因此我们有: $a^{q} = a^{p^{m}} = \overset{a}{ˉ}$ 完全免费!

比如 $(F_{p^{12}})^{p^{6}} = \overset{ˉ}{F}_{p^{12}}, (F_{p^{6}})^{p^{3}} = \overset{ˉ}{F}_{p^{6}}, (F_{p^{2}})^{p} = \overset{ˉ}{F}_{p^{2}}, \dots$ .

Curve 上的算术运算

这里将是Scalar Multiplication 的主要战场。在BLS12-381中有两条曲线我们需要实例化， $G_{1}$ and $G_{2}$ ： $G_{1} G_{2} = E (F_{p}) [r] = E^{'} (F_{p^{2}}) [r]$ 其中 $G_{1}$ 是定义在Base Prime Field $F_{p}$ 上的 $r$ -torsion curve (subgroup) , $G_{2}$ 是定义在sextic-twisted field (relative to $F_{p^{12}}$ )， $F_{p^{12/6}} = F_{p^{2}}$ 上的 $r$ -torsion twisted curve (subgroup).

$G_{1}$ 上的算术运算

$E (F_{p}) : y^{2} = x^{3} + 4$ 其中 $x, y \in F_{p}$ .

$G_{1}$ 定义在 Base Prime Field $F_{p}$ 上，它只是 $E (F_{p})$ 的一个 $r$ -torsion subgroup. 所以它的算术运算(Scalar Multiplication) 跟 $E (F_{p})$ 一样，定义在 $F_{p}$ 。

$G_{2}$ 上的算术运算

$E^{'} (F_{p^{2}}) : y^{2} = x^{3} + 4 \cdot β$ 其中 $x, y, β \in F_{p^{2}}, w = 6 β \in F_{p^{12}}$ .

类似地， $G_{2}$ 只是 $E^{'} (F_{p^{2}})$ 上的 $r$ -torsion subgroup, 它的算术运算 (Scalar Multiplication) 跟 $E^{'} (F_{p^{2}})$ 一样，定义在extension field $F_{p^{2}}$ 上（上面有介绍extension field 的运算）。

$G_{T}$ 上的算术运算

目标group $G_{T}$ 实际上并不是曲线 (additional group)，而是一个 $r$ -torsion multiplicative subgroup，通常表示为 $F_{p^{k}}^{\times} [r]$ 。它的算术运算与 $F_{p^{k}}^{\times}$ 一样.

Python Implementation

Instantiation of Curve BLS12-381

Trace/Unti-trace Map

Trace Map: $T r (Q) = i = 0 \sum k (Q_{x}^{p^{i}}, Q_{y}^{p^{i}})$ where $k$ is the full extension degree. It maps any $r$ -torsion points of $E (F_{p^{k}}) [r]$ into $G_{1} = E (F_{p}) [r]$ .

Untri-trace Map: $U n T r (Q) = [k] Q - T r (Q)$ It maps any $r$ -torsion points of $E (F_{p^{k}}) [r]$ into $G_{2}$ , whose Trace Map result is $O$ .

Since $G_{1}$ is defined over $F_{p}$ , so $Q \in G_{1}, T r (Q) = [d] Q$ . While $Q \in G_{2}, T r (Q) = O$ , this is where Trace-zero subgroup come from.

def anti_trace_map(point, d, p, E):
    return d * point - trace_map(point, d, p, E)

def trace_map(point, d, p, E):
    result = point
    point_t = point
    for i in range(1, d):
        point_x, point_y = list(point_t)[0], list(point_t)[1]
        point_t = E(point_x ** p, point_y ** p)
        result = result + point_t
    return result

Finite Field Conversion

## map element of Fp2 into Fp12
def into_Fp12(e_fp2, beta, F, gen):
    a = beta.polynomial().list()
    if len(a) == 1 :
        a = a + [0]
    e = e_fp2.polynomial().list()
    if len(e) == 1:
        e = e + [0]
    return F(e[0]) + F(e[1]) * (gen ** 6 - F(a[0])) / F(a[1])

## map elements of Fp12 into Fp2 with critical conditions
def into_Fp2(e_fp12, F, gen):
    coef = e_fp12.polynomial().list()
    zero_coeff = [1 for i in range(12) if ((len(coef) > i) and (i != 0) and (i != 6) and (F(coef[i]) == F(0)))]
    assert(reduce(mul, zero_coeff) == 1)
    
    return (F(coef[0]) + F(coef[6])) + gen * F(coef[6])

## map elements of Fp12_t into Fp12
def Fp12_t_into_Fp12(e_fp12_t, F, gen):
    coef = list(e_fp12_t)
    result = []
    for i in range(len(coef)):
        result.append([(F(c) * (((gen ** 6) - F(1)) ** j) * (gen ** i)) for j, c in enumerate(coef[i].polynomial().list())])
    
    return reduce(add, sum(result, []))

Twist and Untwist

def untwist(x, y, t_x, t_y):
    return x / t_x, y / t_y

def twist(x, y, t_x, t_y):
    return x * t_x, y * t_y

Definition of $G_{1}$

$G_{1}$ denotes curve defined base prime field, namely $E (F_{p}) [r]$


p = 4002409555221667393417789825735904156556882819939007885332058136124031650490837864442687629129015664037894272559787
q = 52435875175126190479447740508185965837690552500527637822603658699938581184513

A = 0
B = 4

## base prime field
Fp = GF(p)

## E1 over base prime field, map any point on Efp into the q-torsion subgroup
Efp = EllipticCurve(Fp, [A, B])
r_E = Efp.order()
cofactor_E1 = r_E // q
# g_E1 = Efp(0)
# while g_E1 == Efp(0):
#     a = Efp.random_element()
#     g_E1 = cofactor * a
g_E1 = Efp(
    2262513090815062280530798313005799329941626325687549893214867945091568948276660786250917700289878433394123885724147,
    3165530325623507257754644679249908411459467330345960501615736676710739703656949057125324800107717061311272030899084
)
assert(q * g_E1 == Efp(0))
## trace map on E1 is trival, stays on E1
assert(trace_map(g_E1, 12, p, Efp) == 12 * g_E1)

print('\n ##################################### Curve G1: \n cofactor = {}, \n generator = {}, \n order = {} \n'.format(cofactor_E1, g_E1, r_E))

Definition of $G_{2}^{'}$

$G_{2}^{'}$ denotes curve defined over field $F_{p^{k / d}}$ , namely $E^{'} (F_{p^{k / d}}) [r]$ , who is $d$ -twisted with $E (F_{p^{k}}) [r]$ . In BLS12-381 (sextic-twist), $G_{2}^{'} = E^{'} (F_{p^{2}}) [r]$ .

########## Fp2 = Fp[X] / X^2 - alpha
## alpha = -1
d = 2
alpha = Fp(-1)
X = Fp['X'].gen()
pol2 = X ** d - alpha
assert(pol2.is_irreducible() == True)
Fp2 = GF(p ** d, 'u', modulus = pol2)
u = Fp2.gen()

## Fp12 = Fp2[X] / X^6 - beta
d = 6
beta = u + 1
XX = Fp2['XX'].gen()
pol12 = XX ** d - beta
assert(pol2.is_irreducible() == True)
beta_t = beta 
Efp2_t = EllipticCurve(Fp2, [A, B * beta_t])
## find the proper twisted curve, who has a q-torsion subgroup which is isomorphism with Efpk's one
if Efp2_t.order() % q != 0:
    beta_t = beta ** 5
    Efp2_t = EllipticCurve(Fp2, [A, B * beta_t])

Definition of $G_{12}^{'}$

$G_{12}^{'}$ denotes twisted curve defined over $F_{p^{k}}$ , namely $E^{'} (F_{p^{k}}) [r]$ .

## twist curve E' over Fp12
Fp12_t = Fp2.extension(pol12, 'x')
Efp12_t = Efp2_t.change_ring(Fp12_t)
print('\n Twist curve E defined over Fp12: {}\n'.format(Efp12_t))

Definition of $G_{12}$

$G_{12}$ denotes curve defined over $F_{p^{k}}$ , namely $E (F_{p^{k}}) [r]$ .

## Fp12 = Fp[X] / X^12 - 2X^6 + 2
Fp12 = GF(p ** 12, 'w', modulus = X ** 12 - 2 * (X ** 6) + 2)
w = Fp12.gen()

## constant parameters of twist/untwist 
beta_t_x = w ** 2
beta_t_y = w ** 3

## make sure g_E2 is in the q-torsion subgroup on Efp2_t
r_E2_t = Efp2_t.order()
cofactor_E2_t = r_E2_t // q
# g_E2 = Efp2_t(0)
# while g_E2 == Efp2_t(0):
#     b = Efp2_t.random_element()
#     g_E2 = cofactor_E2_t * b
g_E2 = Efp2_t([
    [
        1265792444950586559339325656560420460408530841056393412024045461464508512562612331578200132635472221512040207420018,
        12405554917932443612178266677500354121343140278261928092817953758979290953103361135966895680930226449483176258412
    ],
    [
        3186142311182140170664472972219788815967440631281796388401764195993124196896119214281909067240924132200570679195848,
        1062539859838502367600126754068373748370820338894390252225574631210227991825937548921368149527995055326277175720251
    ],
])
assert(q * g_E2 == Efp2_t(0))
print('\n #################################### Curve G2: \n cofactor = {}, \n generator = {}, \n order = {} \n'.format(cofactor_E2_t, g_E2, r_E2_t))

## make sure g_E2 is in Fp12 first, uniform the field before untwist
Efp12 = Efp.change_ring(Fp12)
g_E12 = into_E12(g_E2, beta, Fp, w, beta_t_x, beta_t_y, Efp12)

## For the convenience of do Frobenius Map within Fp2, namely (x^p, y^p)
## traditionaly need 3 steps:
## 1. untwist (x, y) to (x', y'), (x', y') = (x / beta_t_x, y / beta_t_y)
## 2. do Frobenius Map within Fp12, (x'^p, y'^p) = (x^p / beta_t_x^p, y^p / beta_t_y^p)
## 3. twist back to (x, y), (x, y) = (x'^p * beta_t_x, y'^p * beta_t_y) = (x^p / beta_t_x^{p - 1}, y^p / beta_t_y^{p - 1})
## 
## Someone may wonder why wouldn't we do Frobenius Map within Fp2 directly? 
## Since one time of Frobenius Map within Fp2, phi(P), may skip out of G2, though P belongs to G2, 
## so we must do it within the FULL EXTENSION Fp12.
##
## Caching beta_t_x^{-(p - 1)} or beta_t_y^{-(p - 1)} would be much preferable
## 
twist_frob_x = into_Fp2(1 / (beta_t_x ** (p - 1)), Fp, u)
twist_frob_y = into_Fp2(1 / (beta_t_y ** (p - 1)), Fp, u)
print('\n Twist parameters: cubic_root(beta_t)^-1 = {}, sqrt(beta_t)^-1 = {} \n'.format(beta_t_x, beta_t_y))
print('\n Twist parameters for Frobenius Map within Fp2: \n cubic_root(beta_t)^-(p - 1) = {}, \n sqrt(beta_t)^-(p - 1) = {} \n'.format(
    twist_frob_x, twist_frob_y
))

print('\n ==================================== DEBUG ====================================\n ')
## make sure g_E12 is in the zero-trace subgroup of q-torsion
assert(q * g_E12 == Efp12(0))
assert(trace_map(g_E12, 12, p, Efp12) == Efp12(0))
print('\n #### UNTWIST: Point of E2 \n {} \n is mapped into E12 \n {} \n successfully! \n'.format(g_E2, g_E12))

## make sure it can be twisted back
x, y = twist(list(g_E12)[0], list(g_E12)[1], beta_t_x, beta_t_y)
x, y = (into_Fp2(x, Fp, u), into_Fp2(y, Fp, u))
assert(Efp2_t(x, y) == g_E2)
print('\n #### TWIST: Point of E12 \n {} \n is mapped into E2 \n {} \n successfully! \n'.format(g_E12, Efp2_t(x, y)))

Weil Pairing

Evaluation of Double-line Function

## evaluation of double line divisor function
## arithmetics on fields, not on multiplicative group
def double_line(line_point, eval_point, E, phi, reverse = False):
    ######################## arithemtic on finite field of line_point
    ## lambda = 3x^2 / 2y
    (x_L, y_L) = (list(line_point)[0], list(line_point)[1])
    (x_E, y_E) = (list(eval_point)[0], list(eval_point)[1])
    alpha = (3 * x_L^2) / (2 * y_L)
    x_2L = alpha * alpha - 2 * x_L
    y_2L = -y_L - alpha * (x_2L - x_L)
    
    ######################## arithmetic on mixed finite field
    ## x_E, y_E \in F2
    ## y_L, x_L, alpha, x_2L \in F1
    if reverse:
        ## evaluation of slop line l_2T
        e_1 = phi(y_E) - y_L - alpha * (phi(x_E) - x_L)
        ## evaluation of vertical line v_2T
        e_2 = phi(x_E) - x_2L
    else:
        ## evaluation of slop line l_2T
        e_1 = y_E - phi(y_L) - phi(alpha) * (x_E - phi(x_L))
        ## evaluation of vertical line v_2T
        e_2 = x_E - phi(x_2L)

    return E(x_2L, y_2L), e_1, e_2

Evaluation of Add-line Function

## evaluation of add line divisor function
## arithmetics on fields, not on multiplicative group
def add_line(line_left_point, line_right_point, eval_point, E, phi, reverse = False):
    ######################## arithemtic on finite field of line_point
    ## lambda = (y2 - y1) / (x2 - x1)
    (x_L, y_L) = (list(line_left_point)[0], list(line_left_point)[1])
    (x_R, y_R) = (list(line_right_point)[0], list(line_right_point)[1])
    (x_E, y_E) = (list(eval_point)[0], list(eval_point)[1])
    alpha = (y_L - y_R) / (x_L - x_R)
    x_LR = alpha * alpha - x_L - x_R
    y_LR = -y_L - alpha * (x_LR - x_L)
    
    ######################## arithmetic on mixed finite field
    ## x_E, y_E \in F2
    ## y_L, x_L, alpha, x_LR \in F1
    if reverse:
        ## evaluation of slop line l_{T + P}
        e_1 = phi(y_E) - y_L - alpha * (phi(x_E) - x_L)
        ## evaluation of vertical line v_{T + P}
        e_2 = phi(x_E) - x_LR
    else:
        ## evaluation of slop line l_{T + P}
        e_1 = y_E - phi(y_L) - phi(alpha) * (x_E - phi(x_L))
        ## evaluation of vertical line v_{T + P}
        e_2 = x_E - phi(x_LR)
    
    return E(x_LR, y_LR), e_1, e_2

Miller Loop

## Miller Loop of Weil Pairing
def MillerLoop(P, Q, G, q, phi, reverse = False):
    T = P
    f1 = 1
    f2 = 1
    e_bits = [int(i) for i in bin(q)[2:]]
    ## last bit cannot be evaluated, since the slope would be a vertical line
    for i in range(1, len(e_bits)):
        if (i == len(e_bits) - 1) and (e_bits[i] == 0):
            f1 = f1 * (list(Q)[0] - list(T)[0])
            T = 2 * T
            break
        T, e_1, e_2 = double_line(T, Q, G, phi, reverse)
        f1, f2 = (f1 * f1 * e_1, f2 * f2 * e_2)
        if (i == len(e_bits) - 1) and (e_bits[i] == 1):
            f1 = f1 * (list(Q)[0] - list(T)[0])
            T = T + P
            break
        if e_bits[i] == 1:
            T, e_1, e_2 = add_line(T, P, Q, G, phi, reverse)
            f1, f2 = (f1 * e_1, f2 * e_2)
    assert(T == G(0))
    
    return f1 / f2

Testation of Weil Pairing

## Weil Pairing Entry
def WeilPairing(P, Qx, G1, G12, q, phi):
    t0 = time.perf_counter()
    f_rP_Q = MillerLoop(P, Qx, G1, q, phi, False)
    t1 = time.perf_counter()
    f_rQ_P = MillerLoop(Qx, P, G12, q, phi, True)
    t2 = time.perf_counter()
    mu_r = ((-1) ** q) * (f_rP_Q / f_rQ_P)
    print('\n ##[Weil Pairing] Time consuming: t[f(P, Qx)] = {:.3f},  t[f(Qx, P)] = {:.3f}'.format(t1 - t0, t2 - t1))
    
    return mu_r


G1, G2_t, G12, G12_t = (Efp, Efp2_t, Efp12, Efp12_t)
C1, C2 = (cofactor_E1, cofactor_E2_t)

## make sure they are in G1 and G2_t repectively
P, Q = (C1 * G1.random_element(), C2 * G2_t.random_element())
assert(q * P == G1(0))
assert(q * Q == G2_t(0))

## untwist from E2_t to E12: Q -> Qx
Qx = into_E12(Q, beta, Fp, w, beta_t_x, beta_t_y, G12)
assert(q * Qx == G12(0))
assert(trace_map(Qx, 12, p, G12) == G12(0))

####################################### Weil Pairing Testation 
## P is defined over E(Fp), Qx is defined over E(Fpk)
## phi maps Fp to Fp12
phi = Hom(Fp, Fp12)(Fp.gen().minpoly().roots(Fp12)[0][0])
assert(P.curve() is not Qx.curve())
mu_r_weil = WeilPairing(P, Qx, G1, G12, q, phi)
## make sure pairing result is in q-torsion subgroup
assert(mu_r_weil ** q == Fp12(1))
#######################################

Output:

## Time consuming: t[f(P, Qx)] = 0.060,  t[f(Qx, P)] = 0.095

Obviousely time cost of $f_{r, Q} (P)$ is much more than that of $f_{r, P} (Q)$ , since $P$ is defined over Base Prime Field, $P \in E (F_{p})$ , while $Q$ is defined over Full Extension Field, $Q \in E (F_{p^{k}})$ .

Double-add on $F_{p^{k}}$ is more expensive than on $F_{p}$
Function evaluation is absolutely defined over $F_{p^{k}}$ , so this part would be almost equal

Tate Pairing

Actually in Tate Pairing the vertical line evaluation can be ommited due to the Final Exponentiation. Let’s prove that!

Recall twist/ untwist operation: $φ : (x^{'}, y^{'}) \mapsto (x, y) ⟹ {x = x^{'} \cdot w^{2} y = y^{'} \cdot w^{3}$ where $x^{'}, y^{'} \in F_{p^{2}}$ , $x, y \in F_{p^{12}}, w \in F_{p^{12}}, w^{2} \in F_{p^{6}}, w^{3} \in F_{p^{4}}$ .

According to definition of embedding degree, $k = 12$ is the minimal value satisfying $r ∣ p^{k} - 1$ , namely $q ∤ p^{2} - 1, q ∤ p^{4} - 1, q ∤ p^{6} - 1$ , so we must have $p^{2} - 1∣ (p^{12} - 1) / q, p^{4} - 1∣ (p^{12} - 1) / q, p^{6} - 1∣ (p^{12} - 1) / q$ .

Also since $x^{' p^{2} - 1} = 1, (w^{2})^{p^{6} - 1} = 1, (w^{3})^{p^{4} - 1} = 1$ , assuming $(p^{12} - 1) / q = c_{1} \cdot (p^{2} - 1) = c_{2} \cdot (p^{6} - 1)$ , then we must have $x^{(p^{12} - 1) / q} = (x^{' p^{2} - 1})^{c_{1}} \cdot ((w^{2})^{p^{6} - 1})^{c_{2}} = 1$ .

Before untwisting $Q \in G_{2}^{'} = E^{'} (F_{p^{2}}) [r]$ , after untwisting $Q \in G_{12} = E (F_{p^{12}}) [r]$ . The vertical line funcion $x - x_{T}$ , the evaluation would be $x_{Q} - x_{T}$ , where $x_{Q}$ is untwisted value and $x_{T} \in F_{p}$ . Finaly we have $(x_{Q} - x_{T})^{(p^{12} - 1) / q} \equiv 1$ .

Optimized Evaluation of Double-line Function

## evaluation of double line divisor function
## arithmetics on fields, not on multiplicative group
def double_line(line_point, eval_point, E, phi, reverse = False):
    ######################## arithemtic on finite field of line_point
    ## lambda = 3x^2 / 2y
    (x_L, y_L) = (list(line_point)[0], list(line_point)[1])
    (x_E, y_E) = (list(eval_point)[0], list(eval_point)[1])
    alpha = (3 * x_L^2) / (2 * y_L)
    x_2L = alpha * alpha - 2 * x_L
    y_2L = -y_L - alpha * (x_2L - x_L)
    
    ######################## arithmetic on mixed finite field
    ## x_E, y_E \in F2
    ## y_L, x_L, alpha, x_2L \in F1
    if reverse:
        ## evaluation of slop line l_2T
        e_1 = phi(y_E) - y_L - alpha * (phi(x_E) - x_L)
        # ## evaluation of vertical line v_2T
        # e_2 = phi(x_E) - x_2L
    else:
        ## evaluation of slop line l_2T
        e_1 = y_E - phi(y_L) - phi(alpha) * (x_E - phi(x_L))
        # ## evaluation of vertical line v_2T
        # e_2 = x_E - phi(x_2L)

    return E(x_2L, y_2L), e_1

Optimized Evaluation of Add-line Function

## evaluation of add line divisor function
## arithmetics on fields, not on multiplicative group
def add_line(line_left_point, line_right_point, eval_point, E, phi, reverse = False):
    ######################## arithemtic on finite field of line_point
    ## lambda = (y2 - y1) / (x2 - x1)
    (x_L, y_L) = (list(line_left_point)[0], list(line_left_point)[1])
    (x_R, y_R) = (list(line_right_point)[0], list(line_right_point)[1])
    (x_E, y_E) = (list(eval_point)[0], list(eval_point)[1])
    alpha = (y_L - y_R) / (x_L - x_R)
    x_LR = alpha * alpha - x_L - x_R
    y_LR = -y_L - alpha * (x_LR - x_L)
    
    ######################## arithmetic on mixed finite field
    ## x_E, y_E \in F2
    ## y_L, x_L, alpha, x_LR \in F1
    if reverse:
        ## evaluation of slop line l_{T + P}
        e_1 = phi(y_E) - y_L - alpha * (phi(x_E) - x_L)
        # ## evaluation of vertical line v_{T + P}
        # e_2 = phi(x_E) - x_LR
    else:
        ## evaluation of slop line l_{T + P}
        e_1 = y_E - phi(y_L) - phi(alpha) * (x_E - phi(x_L))
        # ## evaluation of vertical line v_{T + P}
        # e_2 = x_E - phi(x_LR)
    
    return E(x_LR, y_LR), e_1

Optimized Miller Loop

## General Miller Loop Entry
def MillerLoop(P, Q, G, q, phi, reverse = False):
    T = P
    f1 = 1
    f2 = 1
    e_bits = [int(i) for i in bin(q)[2:]]
    
    print('Miller Loop Length: {}'.format(len(e_bits)))
    
    ## last bit cannot be evaluated, since the slope would be a vertical line
    for i in range(1, len(e_bits)):
        if (i == len(e_bits) - 1) and (e_bits[i] == 0):
            f1 = f1 * (list(Q)[0] - list(T)[0])
            T = 2 * T
            break
        T, e_1 = double_line(T, Q, G, phi, reverse)
        f1 = f1 * f1 * e_1
        if (i == len(e_bits) - 1) and (e_bits[i] == 1):
            f1 = f1 * (list(Q)[0] - list(T)[0])
            T = T + P
            break
        if e_bits[i] == 1:
            T, e_1 = add_line(T, P, Q, G, phi, reverse)
            f1 = f1 * e_1
    assert(T == G(0))
    
    return f1

Easy-part of Final Exponentiation

For illustration convenience, we does not use Frobenius Map trick here, just directly use time-consuming trivial power. Actually it’s almost free cost after using Frobenius Map.

## trival implementation of easy part, Frobenius not used here actually
## exp = (p^6 - 1) * (p^2 + 1)
## 2 * Frobenius + 2 * Mul + 1 * Inv
def easy_part(f):
    ff = f
    ## 1 * Frobenius
    t0 = f ** (p ** 6)
    ## 1 * Inv
    t1 = 1 / f
    ## 1 * Mul
    f = t0 * t1
    ## 1 * Frobenius
    t0 = f ** (p ** 2)
    ## 1 * Mul
    f = t0 * f
    
    actual = ff ** (((p ** 6) - 1) * ((p ** 2) + 1))
    assert(actual == f)
    
    return f

Hard-part of Final Exponentiation

Same as above, we does not use Frobenius Map here.

As we know, the hard part is arithmetics on Cyclotomic Subgroup, namely $F_{Φ_{12}}^{\times}$ . According to On the Computation of the Optimal Ate Pairing at the 192-bit Security Level, the power of hard part is not $\frac{p ^{4} - p ^{2} + 1}{r}$ , but three times of that: $f^{3 \cdot \frac{p ^{4} - p ^{2} + 1}{r}} = f^{λ_{0} + λ_{1} \cdot p + λ_{2} \cdot p^{2} + λ_{3} \cdot p^{3}}$ where: $λ_{3} λ_{2} λ_{1} λ_{0} = x^{2} - 2 x + 1 = λ_{3} \cdot x = λ_{2} \cdot x - λ_{3} = λ_{1} \cdot x + 3$ In conclusion : $e_{T, r} (P, Q) = (f_{r, P} (Q)^{\frac{p ^{k} - 1}{r}})^{3} \neq = f_{r, P} (Q)^{\frac{p ^{k} - 1}{r}}$

## reference from Algorithm 1 of "On the Computation of the Optimal Ate Pairing at the 192-bit Security Level"
## trival implementation of hard part, Frobenius not used here actually
## exp = (p^4 - p^2 + 1) / r
def hard_part(f, u, p, q):
    ## 1 * Sqr + 1 * Inv
    t0 = 1 / (f * f)
    ## 1 * Pow
    t5 = f ** u
    ## 1 * Sqr
    t1 = t5 * t5
    ## 1 * Mul
    t3 = t0 * t5
    
    ## 1 * Pow
    t0 = t3 ** u
    
    ## 1 * Pow
    t2 = t0 ** u
    
    ## 1 * Pow
    t4 = t2 ** u
    
    ## 1 * Mul
    t4 = t1 * t4
    ## 1 * Pow
    t1 = t4 ** u
    ## 1 * Inv
    t3 = 1 / t3
    ## 1 * Mul
    t1 = t3 * t1
    ## 1 * Mul
    t1 = t1 * f # f^\lambda_0
    
    # 1 * Inv
    t3 = 1 / f
    ## 1 * Mul
    t0 = t0 * f
    ## 1 * Frobenius
    t0 = t0 ** (p ** 3) # f^\lambda_3
    
    ## 1 * Mul
    t4 = t3 * t4
    ## 1 * Frobenius
    t4 = t4 ** p # f^\lambda_1
    
    ## 1 * Mul
    t5 = t2 * t5
    ## 1 * Frobenius
    t5 = t5 ** (p ** 2) # f^\lambda_2
    
    ## 3 * Mul
    t5 = t5 * t0
    t5 = t5 * t4
    t5 = t5 * t1
    
    ## third power of actual pairing result
    actual = f ** (((p ** 4) - (p ** 2) + 1) // q)
    assert(t5 == actual ** 3)
    assert(t5 ** q == 1)
    
    return t5

Final Exponentiation

## Final Exponentiation Entry
def FinalExponentiation(f, p, k, q, u, trivial = True):
    if trivial:
        mu_r = f ** (((p ** k) - 1) // q)
    else:
        t0 = time.perf_counter()
        f = easy_part(f)
        t1 = time.perf_counter()
        mu_r = hard_part(f, u, p, q)
        t2 = time.perf_counter()
        print('\n     ##[Hard Part of Tate Pairing] Time consuming: t[easy] = {:.3f},  t[hard] = {:.3f}'.format(t1 - t0, t2 - t1))
    return mu_r

Testation of Tate Pairing

## Tate Pairing Entry
def TatePairing(P, Qx, G1, q, phi, p, k, u, trivial = True):
    t0 = time.perf_counter()
    f = MillerLoop(P, Qx, G1, q, phi, False)
    t1 = time.perf_counter()
    mu_r = FinalExponentiation(f, p, k, q, u, trivial)
    t2 = time.perf_counter()
    print('\n ##[Tate Pairing] Time consuming: t[f(P, Qx)] = {:.3f},  t[exp] = {:.3f}'.format(t1 - t0, t2 - t1))
    
    return mu_r


G1, G2_t, G12, G12_t = (Efp, Efp2_t, Efp12, Efp12_t)
C1, C2 = (cofactor_E1, cofactor_E2_t)

## make sure they are in G1 and G2_t repectively
P, Q = (C1 * G1.random_element(), C2 * G2_t.random_element())
assert(q * P == G1(0))
assert(q * Q == G2_t(0))

## untwist from E2_t to E12: Q -> Qx
Qx = into_E12(Q, beta, Fp, w, beta_t_x, beta_t_y, G12)
assert(q * Qx == G12(0))
assert(trace_map(Qx, 12, p, G12) == G12(0))

####################################### Trivial Tate Pairing Testation
mu_r_tate_1 = TatePairing(P, Qx, G1, q, phi, p, k, True)
assert(mu_r_tate ** q == Fp12(1))
#######################################

####################################### parameter for p(x), q(x), and t(x)
x = -15132376222941642752
t = x + 1
## p = ((x - 1)^2 * (x^4 - x^2 + 1)) / 3 + x
assert((pow((x - 1), 2) * (pow(x, 4) - pow(x, 2) + 1)) // 3 + x == p)
## q = x^4 - x^2 + 1
assert(pow(x, 4) - pow(x, 2) + 1 == q)
## t = x + 1
assert(abs(p + 1 - t) == Efp.order())

####################################### Nontrivial Tate Pairing Testation
mu_r_tate_2 = TatePairing(P, Qx, G1, q, phi, p, k, x, False)
assert(mu_r_tate ** q == Fp12(1))

## The hard part is 3rd power of pairing
assert(mu_r_tate_1 ** 3 == mu_r_tate_2)

The running output:

Miller Loop Length: 255

 ##[Tate Pairing] Time consuming: t[f(P, Qx)] = 0.039,  t[exp] = 0.079
Miller Loop Length: 255

     ##[Hard Part of Tate Pairing] Time consuming: t[easy] = 0.114,  t[hard] = 0.082

 ##[Tate Pairing] Time consuming: t[f(P, Qx)] = 0.051,  t[exp] = 0.195

After applying Frobenius Map, the time cost of final exponentiation would greately reduced.

Ate Pairing

Miller Loop

In Ate Pairing, since $[r] P = O$ , $l_{[r - 1] P, P}$ actually is a vertical line, the last step of Miller Loop cannot evaluated directly, so we used a specific manner to deal with it.

But in Ate Pairing, $[T] P \neq = O$ which is far away from $O$ , no need to worry $l_{[r - 1] P, P}$ , so we will strip that specific manner used in Tate Pairing.

## General Miller Loop Entry
def MillerLoop(P, Q, G, q, phi, reverse = False):
    ## if power q is negative or not
    P = P if q > 0 else -P
    q = q if q > 0 else -q
    
    T = P
    f1 = 1
    e_bits = [int(i) for i in bin(q)[2:]]

    print('Miller Loop Length: {}'.format(len(e_bits)))
    
    for i in range(1, len(e_bits)):
        ##### strip this specific manner used in Tate Pairing
        # if (i == len(e_bits) - 1) and (e_bits[i] == 0):
        #     f1 = f1 * (list(Q)[0] - list(T)[0])
        #     T = 2 * T
        #     break
        T, e_1 = double_line(T, Q, G, phi, reverse)
        f1 = f1 * f1 * e_1
        ##### strip this specific manner used in Tate Pairing
        # if (i == len(e_bits) - 1) and (e_bits[i] == 1):
        #     f1 = f1 * (list(Q)[0] - list(T)[0])
        #     T = T + P
        #     break
        if e_bits[i] == 1:
            T, e_1 = add_line(T, P, Q, G, phi, reverse)
            f1 = f1 * e_1
    
    return f1

Testation of Ate Pairing

Notice that in curve BLS12-381, the parameter $x$ for polynomials $p (x), q (x), t (x)$ is a negative one:

$q (x) p (x) t (x) = x^{4} - x^{2} + 1 = (x - 1)^{2} \cdot q (x) \cdot \frac{1}{3} + x = x + 1$

where $x = - 15132376222941642752$ .

Therefore we must deal with it properly in Miller Loop before looping.

## Ate Pairing Entry
def AtePairing(P, Qx, G1, q, phi, p, k, u, T, trivial = True):
    t0 = time.perf_counter()
    f = MillerLoop(P, Qx, G1, T, phi, False)
    t1 = time.perf_counter()
    mu_r = FinalExponentiation(f, p, k, q, u, trivial)
    t2 = time.perf_counter()
    print('\n ##[Ate Pairing] Time consuming: t[f(P, Qx)] = {:.3f},  t[exp] = {:.3f}'.format(t1 - t0, t2 - t1))
    
    return mu_r

G1, G2_t, G12, G12_t = (Efp, Efp2_t, Efp12, Efp12_t)
C1, C2 = (cofactor_E1, cofactor_E2_t)

## make sure they are in G1 and G2_t repectively
P, Q = (C1 * G1.random_element(), C2 * G2_t.random_element())
assert(q * P == G1(0))
assert(q * Q == G2_t(0))

## untwist from E2_t to E12: Q -> Qx
Qx = into_E12(Q, beta, Fp, w, beta_t_x, beta_t_y, G12)
assert(q * Qx == G12(0))
assert(trace_map(Qx, 12, p, G12) == G12(0))

## parameter for p(x), q(x), and t(x)
x = -15132376222941642752
t = x + 1
## p = ((x - 1)^2 * (x^4 - x^2 + 1)) / 3 + x
assert((pow((x - 1), 2) * (pow(x, 4) - pow(x, 2) + 1)) // 3 + x == p)
## q = x^4 - x^2 + 1
assert(pow(x, 4) - pow(x, 2) + 1 == q)
## t = x + 1
assert(abs(p + 1 - t) == Efp.order())

## p \equiv T \mod q
T = t - 1
####################################### Ate Pairing Testation
mu_r_ate = AtePairing(P, Qx, G1, q, phi, p, k, x, T, False)
assert(mu_r_ate ** q == Fp12(1))

The running output:

Miller Loop Length: 64

     ##[Hard Part of Ate Pairing] Time consuming: t[easy] = 0.105,  t[hard] = 0.081

 ##[Ate Pairing] Time consuming: t[f(P, Qx)] = 0.007,  t[exp] = 0.186

Obviousely time cost of Miller Loop is greatly reduced, since $lo g T$ is far more less than $lo g q$ (64 vs 255).

Rust Implementation

Much testation work need to be done, code to be updated…

References

[1] A note on twists for pairing friendly curves

[2] Pairing-Friendly Elliptic Curves of Prime Order

[3] Pairing for Beginners

[4] Guide to Pairing-based Cryptography

[5] Faster pairing computations on curves with high-degree twists

[6] Optimal Pairings

[7] On the Computation of the Optimal Ate Pairing at the 192-bit Security Level

[8] Efficient Final Exponentiation via Cyclotomic Structure for Pairings over Families of Elliptic Curves

[9] Faster Squaring in the Cyclotomic Subgroup of Sixth Degree Extensions

[10] A Guide to Plane Algebraic Curves

Touch

twitter: @pingzhouyuan
email: joepayne@163.com
wechat: paynejoe

深入分析SuperNova及其ROM实现

针对于为有限状态机上程序执行的正确性的问题，Nova是集大成者，作者Setty提出了一种基于Folding的递归证明系统。但是Nova要求在迭代中使用相同的业务电路，可以理解为仅支持单个指令。SuperNova则对其进行了拓展，在每步迭代中可以运行不同的指令(这一问题定义为NIVC, non-uniform IVC)，因此可以把Nova看作是只支持一个指令的NIVC解决方案。之前采用全局电路的方法其开销与所有指令构成的电路规模有关，Supernova最大的创新则是其证明开销只与当前步执行的指令有关，并且产生的overhead是常数。

本文首先介绍NIVC问题的定义，以及Supernova的基本思路，最后针对于文中没有给出具体说明的电路选择器，详细介绍了ROM模型的实现思路。

NIVC定义

NIVC是对IVC的泛化，在每步增量计算中，Prover可以证明满足一些列relation中的一种relation，所以他可以支持每步使用不同的电路。首先定义NIVC要证明的电路形式，假设存在 $‘ l ‘$ 个多项式时间可计算的函数 $‘ F_{1}, F_{2}, \dots, F_{l} ‘$ (可以把他们看作是执行一些列不同指令的电路)，他们满足: $‘ z_{i + 1} = F_{ϕ (w_{i}, z_{i})} (w_{i}, z_{i}) ‘$ ，其中 $‘ ϕ ‘$ 为选择器，其根据当前witness $‘ w_{i} ‘$ 和公共输出 $‘ z_{i} ‘$ 选择其中第 $‘ j ‘$ 个函数 $‘ F_{j} ‘$ ，即输出 $‘ j, 1 \leq j \leq l ‘$ 。

Prover则是要生成proof，其可以证明对于n步迭代中产生的一系列 $‘ {ω_{0}, \dots, w_{n - 1}}$ 和 ${z_{0}, \dots, z_{n - 1}} ‘$ 均满足 $‘ z_{i + 1} = F_{ϕ (w_{i}, z_{i})} (w_{i}, z_{i}) ‘$ 。可将其形式化表述为 $‘ P (p k, (i, z_{0}, z_{i}), ω_{i}, Π_{i}) \to Π_{i + 1} ‘$ ，其中P为Prover，pk为prover key， $‘Π‘$ 为proof。与IVC类似，NIVC要求Prover在任意步的证明开销与之前调用的指令无关，否则会导致电路规模无限增大；更进一步要求Prover的开销只和当前步运行的电路规模有关，否则就蜕化成了用一个包含所有函数电路构成的IVC。

Supernova证明系统

对于上述证明问题，Supernova采用了类似与Nova的folding scheme，总体来说其也是先构建一个Augumented函数 $‘ F_{j}^{'} ‘$ ，通过证明存在满足 $‘ F_{j}^{'} ‘$ 的witness，来证明业务电路F以及每次迭代更新proof的正确性。 $‘ F_{j}^{'} ‘$ 每次需要把relaxed R1CS实例(U)和r1cs实例(u)进行fold，而且folding scheme要求两种实例的结构是一样的，但是NIVC中 $‘ F^{'} ‘$ 函数有多个，不能简单地fold。因此，SuperNova中在第 $‘ i ‘$ 步 $‘ F_{j}^{'} ‘$ 会输入一系列的 $‘ U_{i} ‘$ ，其中 $‘ U_{i} [j] ‘$ 代表 $‘ F_{j}^{'} ‘$ 从0到 $‘ i - 1‘$ 步被正确执行，这样只需要验证所有的 $‘ U_{i} ‘$ 是否满足约束就可以验证所有函数从0到 $‘ i - 1‘$ 步被正确执行；此外 $‘ F_{j}^{'} ‘$ 还会输入一个实例u，用来证明第 $‘ i ‘$ 步也被正确执行。对于Augumented函数，相对于Nova的不同点在于，在第 $‘ i ‘$ 步只折叠第 $‘ p c_{i} = ϕ (w_{i}, z_{i}) ‘$ 个实例，为了确保执行的是 $‘ p c_{i} ‘$ ，需要将 $‘ p c_{i} ‘$ 也作为公共输入放入 $‘ z_{i} ‘$ 中来进行检验。

Supernova证明系统的核心构造为：

说明：实际上Relaxed R1CS(Az◦Bz = uCz + E)和R1CS(Az◦Bz=Cz)中的A,B,C是一致（这些值由业务电路+Folding相关的约束生成），只是具体的z不一样。

需要注意的是上述证明系统并没有明确约束第 $‘ i ‘$ 步具体选择哪个电路，因此如果需要确定性生成相应的选择器，还需增加选择器电路。然而论文中没有给出选择器的具体实现，下面参考PSE一位成员给出的一种电路序列固定的Supernova实现，进一步给出具体实现细节。

ROM machine based Supernova

Rom( read-only memory)模型将所有的电路看作电路序列，该序列共有 $‘ n ‘$ 个电路，其中不同的电路共有 $‘ l ‘$ 个，并将所有的电路直接写死在Supernova的公共输入 $‘ z [1\dots l] ‘$ 中，每迭代一步 $‘ p c + 1‘$ , $‘ p c ‘$ 则放入 $‘ z [0] ‘$ 中。在第 $‘ i ‘$ 步时，读取 $‘ p c_{i} = z [0] ‘$ ，并选取 $‘ z [p c_{i}] ‘$ 对应的电路。比如共有2个不同的电路 $‘ C i rc u i t_{1}, C i rc u i t_{2} ‘$ ，ROM构成的电路序列为 $‘ C i rc u i t_{1}, C i rc u i t_{2}, C i rc u i t_{1}, C i rc u i t_{1} \dots‘$

那么在Supernova论文给出的证明系统之上，还需保证：

在 $‘ i ‘$ 步fold的是第 $‘ i ‘$ 个电路；
在第 $‘ i ‘$ 步选择是第 $‘ ro m [i] ‘$ 电路（注意这点在supernova中没有要求)

对于第1个问题，主要通过构造一个条件选择电路，具体电路如下：

    // select target when index match last_augmented_circuit_index, other left as empty

    let U: Result<Vec<AllocatedRelaxedR1CSInstance<G>>, SynthesisError> = U
      .iter()
      .enumerate()
      .map(|(i, U)| {
        let i_alloc = alloc_const(
          cs.namespace(|| format!("U_i i{:?} allocated", i)),
          scalar_as_base::<G>(G::Scalar::from(i as u64)),
        )?;

        let equal_bit = Boolean::from(alloc_num_equals(
          cs.namespace(|| format!("check U {:?} equal bit", i)),
          &i_alloc,
          last_augmented_circuit_index,
        )?);

        conditionally_select_alloc_relaxed_r1cs(
          cs.namespace(|| format!("select on index namespace {:?}", i)),
          U,
          &empty_U,
          &equal_bit,
        )
      })
      .collect();

对于第2个电路，核心思路是构造 $i = 1 \sum 10 (ro m v a l u e [i]) = ro m [p c_{i}]$ 来实现其约束, 其中 $‘ ro m$ value[i]=rom[i],i=pci0,i=pc[i]‘

具体代码如下:

fn constraint_augmented_circuit_index<F: PrimeField, CS: ConstraintSystem<F>>(
    mut cs: CS,
    pc_counter: &AllocatedNum<F>,
    rom: &[AllocatedNum<F>],
    circuit_index: &AllocatedNum<F>,
  ) -> Result<(), SynthesisError> {

    // select target when index match or empty
    let zero = alloc_zero(cs.namespace(|| "zero"))?;
    let rom_values = rom
      .iter()
      .enumerate()
      .map(|(i, rom_value)| {
        let index_alloc = alloc_const(
          cs.namespace(|| format!("rom_values {} index ", i)),
          F::from(i as u64),
        )?;

        let equal_bit = Boolean::from(alloc_num_equals(
          cs.namespace(|| format!("rom_values {} equal bit", i)),
          &index_alloc,
          pc_counter,
        )?);

        conditionally_select(
          cs.namespace(|| format!("rom_values {} conditionally_select ", i)),
          rom_value,
          &zero,
          &equal_bit,
        )
      })

      .collect::<Result<Vec<AllocatedNum<F>>, SynthesisError>>()?;

    let sum_lc = rom_values
      .iter()
      .fold(LinearCombination::<F>::zero(), |acc_lc, row_value| {
        acc_lc + row_value.get_variable()
      });

    println!("self.circuit index ==============> : {:?}", circuit_index.get_value());
    cs.enforce(
      || "sum_lc == circuit_index",
      |lc| lc + circuit_index.get_variable() - &sum_lc,
      |lc| lc + CS::one(),
      |lc| lc,

    );
    Ok(())

  }

致谢

非常感谢 SECBIT Labs 的 @郭宇老师对SuperNova研究方向的指导。

参考文献

ZKP Public Goods

[[# Arithmetic circuits

2.1 Encoding the trace as arithmatic constraints

R1CS

**Flattening：将电路的执行转换成计算轨迹，**即将复合函数以乘法为基本单元拆解成一组有序的简单函数 $‘ {co n s t r ain t_{1}, \dots, co n s t r ain t_{n}} ‘$ ，其中
- $‘ co n s t r ain t_{i} := w_{i} = (u_{i 1} + \dots + u_{i t}) * (v_{i 1} + \dots + v_{i v}) ‘$ , $‘ w_{i} ‘$ 为输出变量， $‘ {u_{1}, \dots, u_{n}} ‘$ 为左输入变量， $‘ {v_{1}, \dots, v_{m}} ‘$ 为右输入变量
- 这里的有序是指按电路执行的顺序
- 这里会引入中间变量 $‘ {sy m 1, \dots, sy m k} ‘$
  - 除了根节点处的门之外，其它的门的输出引脚添加对应的中间变量 $‘ sy m_i ‘$
  - 除了叶子节点处的门之外，其他的门的输入引脚添加中间变量 $‘ sy m_i ‘$ ，该中间变量来自于另一个门的输出
  - 举例说明：若门A的输出引脚接入到门B的输入引脚，则为门A的输出引脚和门B的输入引脚添加同一个中间变量 $‘ sy m_i ‘$
重组 $‘ {co n s t r ain t s} ‘$ 中的数据：将其变成一阶约束系统R1CS： $‘ W \cdot a = U \cdot a \circ V \cdot a ‘$ (注： $‘ \circ ‘$ 为Hadamard product，按位乘法):
- $‘ a := {o n e} + {o u t} + {x_{1}, \dots, x_{h}} + {sy m 1, \dots, sy m k} ‘$ ，即由表示1的冗余变量，函数输出，输入变量，中间变量构成的集合对应的向量。
- $‘ W := {co n s t r ain t_{1}, \dots, co n s t r ain t_{n}} ‘$ 的输出变量基于 $‘ a ‘$ 的选择向量构成的矩阵
- $‘ U := {co n s t r ain t_{1}, \dots, co n s t r ain t_{n}} ‘$ 的左输入变量基于 $‘ a ‘$ 的选择向量构成的矩阵
- $‘ V := {co n s t r ain t_{1}, \dots, co n s t r ain t_{n}} ‘$ 的右输入变量基于 $‘ a ‘$ 的选择向量构成的矩阵
注：矩阵的行数等于乘法门的数量，矩阵的列数等于 $‘ a ‘$ 中元素的数量，即变量的数量

Plonkish Arithmetization

**Flattening：**即将复合函数拆解成一组离散的门 $‘ {co n s t r ain t_{1}, \dots, co n s t r ain t_{n}} ‘$ ，其中
- $‘ co n s t r ain t_{i} := q_{O i} w_{i} = q_{L i} u_{i} + q_{R i} v_{i} + q_{M i} u_{i} v_{i} + q_{C i} c_{i} ‘$ ， $‘ w_{i} ‘$ 为输出变量， $‘ u_{i} ‘$ 为左输入变量， $‘ v_{i} ‘$ 为右输入变量， $‘ c_{i} ‘$ 为常量， $‘ q_{O i} ‘$ 为输出选择器， $‘ q_{L i} ‘$ 为左输入变量选择器， $‘ q_{R i} ‘$ 为右输入变量选择器， $‘ q_{M i} ‘$ 为乘积选择器， $‘ q_{C i} ‘$ 为常数选择器
- **注：**矩阵的行数等于所有门的数量，即约束的数量，n。
- 这里的有序是指计算的顺序
- 这里会引入中间变量 $‘ {sy m 1, \dots, sy m k} ‘$
  - 除了根节点处的门之外，其它的门的输出引脚添加对应的中间变量 $‘ sy m_i ‘$
  - 除了叶子节点处的门之外，其他的门的输入引脚添加中间变量 $‘ sy m_i ‘$ ，该中间变量来自于另一个门的输出
  - 举例说明：若门A的输出引脚接入到门B的输入引脚，则为门A的输出引脚和门B的输入引脚添加同一个中间变量 $‘ sy m_i ‘$
**重组 $‘ {co n s t r ain t_{1}, \dots, co n s t r ain t_{n}} ‘$ 中的数据：**将其变成： $‘ q_{O} \circ w = q_{L} \circ u + q_{R} \circ v + q_{M} \circ (u \circ v) + q_{C} ‘$ (注： $‘ \circ ‘$ 为Hadamard product，按位乘法)
- $‘ Q := {q_{O}, q_{L}, q_{R}, q_{M}, q_{C}} ‘$ ，即选择器矩阵
- $‘ W := {w, u, v} ‘$ ，即变量矩阵
- $‘ S^{δ} := ‘$ 轮换置换后得到的位置集合，来自于Wiring
Wiring(Copy Constraints)
- 分析：Wiring即将离散的门连接起来，即某一个门的输出引脚要接入另一个门的输入引脚 $‘ ⟺ ‘$ 约束变量矩阵 $W$ 中某几个位置的元素是相等的 $‘ ⟺ ‘$ 这一个元素出现在 $‘ W ‘$ 矩阵的多个位置处
- Wiring实现思路：
  - 把 $‘ W ‘$ 矩阵中的每一个位置从1到3n进行唯一编号，则所有的编号构成一个位置集合 $‘ S ‘$ ，将位置集合 $S$ 对应的元素取出构成一个multiset $‘ S_{e} ‘$
  - 把每个元素出现在 $W$ 中的位置编号取出放在一个集合中 $‘ s ‘$ ，即一个元素对应一个位置集合 $‘ s ‘$ 。将位置集合对应的元素取出构成一个multiset $‘ s_{e} ‘$ 。所有元素的 $s$ 的并集即为 $‘ S ‘$ ， $‘ s_{e} ‘$ 的并集为 $‘ S_{e} ‘$
  - $‘\forall s ‘$ ，要使得 $‘ s_{e} ‘$ 中元素全部相等
  $‘ ⟺ ‘$ $‘\forall s_{e} ‘$ ， $‘ s_{e} ‘$ 与其进行轮换置换 $‘ δ ‘$ 后得到的集合 $‘ s_{e}^{δ} ‘$ 在Multiset的意义上是等价的
  
  $‘ ⟺ ‘$ $‘\forall s_{e} ‘$ ， $‘ s_{e} + s ‘$ 与 $‘ s_{e} + s^{σ} ‘$ 在Multiset的意义上是等价的
  
  $‘ \Leftarrow ‘$ 令 $‘ S ‘$ 为所有 $‘ s ‘$ 的并集， $‘ S^{σ} ‘$ 为所有 $‘ s^{σ} ‘$ 的并集， $‘ S_{e} ‘$ 为所有 $‘ s_{e} ‘$ 的并集， $‘ S_{e} + S ‘$ 与 $‘ S_{e} + S^{σ} ‘$ 在Multiset的意义上是等价的
  
  $‘ ⟺$ 令 $T = S_{e} + S, T^{σ} = S_{e} + S^{σ} ‘$ ，取随机数 $‘ γ ‘$ ，有
  
  $‘ (γ - t_{0}) (γ - t_{1}) \dots (γ - t_{n - 1}) = (γ - t_{0}^{σ}) (γ - t_{1}^{σ}) \dots (γ - t_{n - 1}^{σ}) ‘$
  
  $‘ 即 i \in [n] \prod (γ - t_{i}) = i \in [n] \prod (γ - t_{i}^{σ}) ‘$
  
  $‘ 即 i \in [n] \prod \frac{( γ - t _{i} )}{( γ - t _{i}^{σ} )} = 1‘$
  - 至此，问题转化成如何证明连乘等式 $‘ b_{0} \cdot b_{1} \cdot b_{2} \cdot \dots b_{n - 1} = c ‘$ ，即证明一个n步递归，
    - 初始值： $‘ r_{0} = 1‘$
    - 递归定义： $‘ r_{i} = r_{i - 1} \cdot b_{i - 1} ‘$
    - 终止条件： $‘ r_{n} = c ‘$
    则有
    
    $‘ b_{0} \cdot b_{1} \cdot b_{2} \cdot \dots b_{n - 1} = c ⟺ r_{0} = 1, r_{i} = r_{i - 1} \cdot b_{i - 1} ， r_{n} = c ‘$
    
    所有 $‘ r_{i} ‘$ 构成向量 $‘ r ‘$
    - 至此，Wiring转化成三个约束
      - $‘ r_{0} = 1 和 r_{n} = c ‘$ 即约束向量的指定位的值为k，即约束 $‘ r ‘$ 的第1位( $‘ r_{0} ‘$ )的值为1，第n+1位( $‘ r_{n} ‘$ )的值为 $‘ c ‘$ 。
        
        设 $‘ e_{i} ‘$ 为n维向量空间的标准基的第i个基向量，向量 $‘ r ‘$ 的第 $‘ i ‘$ 位为 $‘ k ‘$ 等价于： $‘ e_{i} \circ r = k \times e_{i} ‘$
      - $‘ r_{i} = r_{i - 1} \cdot b_{i - 1} ‘$

2.2 Constraints Merge

R1CS to QAP

$‘ L e mma 1 : ‘$ 带有Hadamard product运算的n维向量的群 $‘ M_{n} ‘$ ，和带有乘法运算的在 $H$ 上的最高项次数不大于n-1的单变量多项式 $‘ H_{p}^{(\leq n - 1)} [X] ‘$ 的群，映射： $‘ h : M_{n} \to H_{p}^{(\leq n - 1)} ‘$ ,令 $‘ L_{i} (X) 为 L a g r an g e B a s i s ‘$ ，有 $‘ h (m) = ⟨ m, L_{i} (X)⟩ ‘$ ，是群同态
$‘ L e mma 2 : 由 L e mma 1 ，有 ‘$

$‘ W_{m \times n} \cdot a = U_{m \times n} \cdot a \circ V_{m \times n} \cdot a ‘$ $‘ ⟺ \forall X \in H, ⟨ ⟨ w, L_{i} (X)⟩, a ⟩ = ⟨ ⟨ u, L_{i} (X)⟩, a ⟩ \cdot ⟨ ⟨ v, L_{i} (X)⟩, a ⟩ ‘$
$‘ L e mma 3 : 令 c (X) = ⟨ ⟨ w, L_{i} (X)⟩, a ⟩, a (X) = ⟨ ⟨ u, L_{i} (X)⟩, a ⟩ ， b (X) = ⟨ ⟨ v, L_{i} (X)⟩, a ⟩, 有 ‘$

$‘\forall X \in H, c (X) = a (X) \cdot b (X) ‘$ $‘ ⟺ \forall X \in H, a (X) \cdot b (X) - c (X) = 0 ⟺ f (X) = a (X) \cdot b (X) - c (X) = 0 以 H 为根， X \in F ⟺ f (X) 能被 z_{H} (X) = (X - h_{0}) (X - h_{1}) (X - h_{2}) \dots (X - h_{n - 1}) 整除, h_{i} \in H ‘$
令 $‘ q (x) = f (X) / z_{H} (X) ‘$ , 至此，完成了从R1CS到QAP到转换

Plonkish Arithmetization to QAP

Plonkish Arithmetization包含两部分约束：

$‘ q_{O} \circ w = q_{L} \circ u + q_{R} \circ v + q_{M} \circ (u \circ v) + q_{C} ‘$ 和 $‘ r_{0} = 1, r_{i} = r_{i - 1} \cdot b_{i - 1} ， r_{n} = c ‘$

第一部分约束每个门是正确计算的，即所谓算术约束；第二部分约束门与门之间正确连接，即所谓复制约束。

首先来转换算术约束：

$‘ L e mma 4 : ‘$ 带有加法的n维向量的群 $‘ M_{n} ‘$ ，和带有加法的在 $H$ 上的最高项次数不大于n-1的单变量多项式 $‘ H_{p}^{(\leq n - 1)} [X] ‘$ 的群，映射： $‘ h : M_{n} \to H_{p}^{(\leq n - 1)} ‘$ ，令 $‘ L_{i} (X) 为 L a g r an g e B a s i s ‘$ ，有$h(\vec m)= \langle \vec m,\vec L(X) \rangle $，是群同态 -$ Lemma5: $同态映射的复合映射必定是同态映射 -$ 由Lemma1,Lemma4,Lemma5,有\vec{q_O}\circ \vec{w}=\vec{q_L}\circ\vec{u}+\vec{q_R}\circ\vec{v}+\vec{q_M}\circ(\vec{u}\circ\vec{v})+\vec{q_C}\circ\vec{c} \\ \iff \langle \vec q_O,\vec L(X) \rangle \cdot \langle \vec w,\vec L(X) \rangle=\langle \vec q_L,\vec L(X) \rangle \cdot \langle \vec u,\vec L(X) \rangle+\langle \vec q_R,\vec L(X) \rangle \cdot \langle \vec v,\vec L(X) \rangle+\langle \vec q_m,\vec L(X) \rangle \cdot (\langle \vec u,\vec L(X) \rangle\cdot\langle \vec v,\vec L(X) \rangle )+\langle \vec q_C,\vec L(X) \rangle $令$ a(X) =\langle \vec a,\vec L(X) \rangle $，上式转化为：$ q_O(X)w(X)=q_L(X)u(X)+q_R(X)v(X)+q_M(X)u(X)v(X)+q_C(X) $- 至此， n 个算术约束转化成了一个由八个 n - 1 次多项式之间构成的约束。 * * 接着转换复制约束： * * - 由$ Lemma1 $，有$ \vec e_i \circ \vec r=k\times \vec e_i \\ \iff L_i(X)r(X)=k\times L_i(X) \\ \iff L_i(X)(r(X)-k)=0 $有$ r_0=1 \iff L_0(X)(r(X)-1)=0 \\ r_n=c \iff L_n(X)(r(X)-c)=0 $- 令$ L_i(X) $为定义在乘法子群$ H $上的$ Lagrange Basis $，由$ Lemma1 $, 有$ \vec r_{i}=\vec r_{i-1} \circ \vec b_{i-1} \\ \iff \langle \vec r,\vec L(\omega \cdot X) \rangle =\langle \vec r,\vec L(X) \rangle \cdot \langle \vec b,\vec L(X) \rangle
至此，复制约束转换成了三个多项式约束。

2.3 A function commitment scheme

在2.3中得到了一系列多项式之间的约束，本节我们来看如何实现多项式约束，

令：

\mathcal F:=function\ family $，即一类多项式$ \mathbb F_p:= 有限域

对于\mathcal F $的 C o mmi t m e n tS h ce m e 框架如下： -$ `setup(\lambda) \to pp` $计算 p u b l i c p a r am e t er -$ `commit(pp,f,r) \to com_f基于随机数r对f\in \mathcal F的承诺` $-$ `eval(prover \ P,verifier\ V)` $对于给定的$ `com_f` $，以及$ `x\in X,y\in Y:证明f(x)=y,即所谓的将f在点(x,y)处打开` $-$ `P(pp,f,x,y,r) \to 简短证明\pi` $-$ `V(pp,com_f,x,y,\pi)\to 接受/拒绝`

三类典型的Function Family Commiments

Polynominal commitments：次数不大于d的单变量多项式承诺 f(X)\in \mathbb F_p^{(\leq d)} [X] $- M u lt i l in e a rco mmi t m e n t s ：次数小于等于 1 的多变量多项式承诺$ f(X_1,...,X_k)\in \mathbb F_p^{(\leq 1)}[X_1,...,X_K] $- L in e a rco mmi t m e n t s ：$ f_{\vec v}(\vec u)= \left \langle \vec u, \vec v \right \rangle=\sum _{i=1}^nu_iv_i

这三者从上到下，越来越general

PCS: Polynominal Commitment Scheme

适用于次数不大于d的单变量多项式 f(X)\in \mathbb F_p^{(\leq d)} [X]

Some usual PSC

Bulletproofs：基于椭圆曲线，verifier的算法复杂度与d成线性相关
KZG‘10，Dory’20：基于双线性椭圆曲线
Dark’20：基于阶未知的群
FRI：基于hash Function

KZG poly-commit scheme

预备知识：阶为p的群\ \mathbb G:=\{1,G,2\cdot G,3\cdot G,...,(p-1)\cdot G\} ,其中，G为生成元 $-$ setup(\lambda) \to pp $- 取随机数$ \alpha\in \mathbb F_p $-$ pp=(H_0=1,H_1=\alpha \cdot G,H_2=\alpha^2 \cdot G,...,H_d=\alpha^d \cdot G)\in \mathbb G^{d+1} $- 删除$ \alpha $，$ \alpha $也称为 G o d k ey ，即除了上帝，$ \alpha $不能被任何人知道 -$ commit(pp,f,r) \to com_f $-$ com_f:=f(\alpha)\cdot G \in \mathbb G $：具体的计算方法如下：$ f(X)=f_0+f_1X+...+f_dX^d\implies com_f=f_0\cdot 1+f_1\cdot\alpha G+f_2\cdot\alpha^2 G+ ...+f_d\cdot \alpha^dG\iff com_f=f_0\cdot H——1+f_1\cdot H1+...+f_d\cdot H_d $- 注意，此处是 B in d in g 的，但由于未做随机处理，故不是 H i d in g 的，若需 H i d in g ，需要 e x t e n d -$ eval(prover \ P,verifier\ V) $- 目标：证明$ f(u)=vf(u)=v\iff u是 \hat f =f-v的根\iff (X-u)整除\hat f\iff \exists q\in \mathbb{F}_p[X]\ \ s.t.\ \ q(X)\cdot(X-u)=f(X)-v $-$ Prover(pp,f,u,v) $计算$ 商多项式q(X) 及其承诺com_q $，发送给 V er i f i er -$ Verifier(pp,com_f,u,v) $检查$ (\alpha-u)\cdot com_q=com_f-v\cdot G $是否成立 - 此处的问题是$ \alpha $是不可知的，那如何在不用显式地知道$ \alpha $的前提下验证等式$ (\alpha-u)\cdot com_q=com_f-v\cdot G $呢？在$ com_q和com_f $中我们通过 se t u p 步骤将$ \alpha $隐藏了，那么等式左侧的$ (\alpha-u) $是不是同样也可以通过 se t u p 隐藏起来？为达到这个目的，我们需要扩展 se t u p 成如下 -$ setup(\lambda) \to pp $- 取随机数$ \alpha\in \mathbb F_p $-$ pp=(H_0=1,H_1=\alpha \cdot G,H_2=\alpha^2 \cdot G,...,H_d=\alpha^d \cdot G)\in \mathbb G^{d+1} + (T_0=1,T_1=\alpha \cdot G_2) \in \mathbb G_2^1 $， - 删除$ \alpha $，$ \alpha $也称为 G o d k ey ，即除了上帝，$ \alpha $不能被任何人知道 -$ Verifier(pp,com_f,u,v) $- 引入双线性映射关系$ e\in \mathbb G \times \mathbb G_2 \to \mathbb G_X$ - 至此，将原来需要验证的 $‘ (α - u) \cdot co m_{q} = ? co m_{f} - v \cdot G ‘$ ，转换成了在 $‘ G_{X} ‘$ 上验证 $‘ e (co m_{q}, T_{1} - u \cdot T_{0}) = ? e (co m_{f} - v \cdot G, T_{0}) ‘$

2.4 Polynominal IOP

Useful Lemma

Lemma1: Schwartz zipple定理
Lemma2: 单位根和乘法子群**：**

令 $‘ ω \in F_{p} ‘$ 为k次单位根，即 $‘ ω^{k} = 1‘$

乘法子群 $‘ H := {1, ω, ω^{2}, \dots, ω^{k - 1}} \subseteq F_{p} ‘$

由于单位根的对称性，有 $‘ i = 0 \prod k - 1 (X - ω^{i}) = X^{k} - 1‘$
Lemma3: $‘ H ‘$ 中的元素 $‘ ω^{i} ‘$ 均为 $‘ f ‘$ 的根，即 $‘ f 在 H 上均为 0‘$ $‘ ⟺ ‘$ $‘ f (x) 能被 i = 0 \prod k - 1 (X - ω^{i}) 整除 ‘$ $‘ ⟺ ‘$ $‘ f (x) 能被 X^{k} - 1 整除 ‘$

$‘ ⟺ ‘$ 存在商多项式 $‘ q (X) = f (X) / (X^{k} - 1) ‘$

Poly-IOP可以高效完成的任务

Task1 zero-test：证明 $f$ 在H上等于0，即证明H中的元素均为 $f$ 的根
Task2 sum-check：证明 $‘ \sum_{a \in H} f (a) = b ‘$ ，即证明 $f$ 在H上全部取值的和等于b
Task3 prod-check：证明 $‘ \prod_{a \in H} f (a) = c ‘$ ，即证明 $f$ 在H上全部取值的和等于c

Zero Test on H

Prover 向 Verifier Commit $‘ f (X) 和 q (X), 即 C o m_{f}, C o m_{q} ‘$
Verifier 向Prover 发送随机数r
Verifier 检查 $‘ f (r) = ? q (r) \cdot (r^{k} - 1) ‘$

参考资料

https://github.com/sec-bit/learning-zkp/blob/develop/plonk-intro-cn/plonk-arithmetization.md

https://www.youtube.com/watch?v=J4pVTamUBvU&list=PLj80z0cJm8QErn3akRcqvxUsyXWC81OGq&index=2

https://github.com/sec-bit/learning-zkp/blob/develop/plonk-intro-cn/plonk-polycom.md ](https://github.com/zkp-co-learning/ZKP/edit/main/%E7%AC%AC%E4%BA%8C%E7%AB%A0.md)https://github.com/zkp-co-learning/ZKP/edit/main/%E7%AC%AC%E4%BA%8C%E7%AB%A0.md](https://github.com/zkp-co-learning/ZKP/edit/main/%E7%AC%AC%E4%BA%8C%E7%AB%A0.md)https://github.com/zkp-co-learning/ZKP/edit/main/%E7%AC%AC%E4%BA%8C%E7%AB%A0.md

本文假设您对椭圆曲线运算及哈希函数等有着基础的了解

简洁的 Schnorr 协议

sk = a ( secret key = a )
PK = aG

a secret key $a$ that corresponds to a public key $g^{a}$ .

请注意「映射」这个词，给任意一个有限域上的整数 r，我们就可以在循环群中找到一个对应的点 rG，或者用一个标量乘法来表示 r*G。但是反过来计算是很「困难」的，这是一个「密码学难题」—— 被称为离散对数难题。

取模之后 , 就很难知道原来的指数是多少了。事实上，如果模取得相当大，从运算结果倒推指数运算就不可行了；现代密码学很大程度上就是基于这个问题的“困难”

也就是说，如果任意给一个椭圆曲线循环群上的点 R，那么到底是有限域中的哪一个整数对应 R，这个计算是很难的，如果有限域足够大，比如说 256bit 这么大，我们姑且可以认为这个反向计算是不可能做到的

Schnorr 协议充分利用了有限域和循环群之间单向映射，实现了最简单的零知识证明安全协议：Alice 向 Bob 证明她拥有 PK 对应的私钥 sk

第一步：为了保证零知识，Alice 需要先产生一个随机数 r，这个随机数的用途是用来保护私钥 $a$ 无法被 Bob 抽取出来。这个随机数也需要映射到椭圆曲线群上即 rG。 ( 映射之后 , Bob 就不可能通过 rG 推算出 r )
第二步：Bob 要提供一个随机数进行挑战，我们把它称为 c。
第三步：Alice 根据挑战数 c 计算 z = r + c * a (即sk)，把 z 发给 Bob，Bob 在自己这边通过下式进行检验：

#![allow(unused)]
fn main() {
z*G ?= R + c*PK 
    ?= rG + c*(aG)
}

大家可以看到 Bob 在第三步「同态地」检验 z 的计算过程。如果这个式子成立，那么就能证明 Alice 确实有私钥 a。可是，这是为什么呢？

z 的计算和验证过程很有趣，有几个关键技巧：

首先 Bob 必须给出一个「随机」挑战数 $c$ ，然后 Bob 在椭圆曲线上同态地检查 z 。如果我们把挑战数 $c$ 看成是一个未知数，那么 r+a*c=z 可以看成是一个一元一次方程，其中 r 与 a 是方程系数。请注意在 c 未知的前提下，如果 r + a*x = r' + a'*x 要成立，那么根据 Schwatz-Zippel 定理，极大概率上 r=r'，a=a' 都成立。也就是说， Alice 在 c 未知的前提下，想找到另一对不同的 r',a' 来计算 z 骗过 Bob 是几乎不可能的。这个随机挑战数 c 实现了r 和 a 的限制。虽然 Bob 随机选了一个数，但是由于 Alice 事先不知道，所以 Alice 不得不使用私钥 a 来计算 z。这里的关键： c 必须是个随机数。
Bob 验证是在椭圆曲线群上完成。Bob 不知道 r ，但是他知道 r 映射到曲线上的点 R ；Bob 也不知道 a，但是他知道 a 映射到曲线群上的点 PK，即 a*G。通过同态映射与Schwatz-Zippel 定理，Bob 可以校验 z 的计算过程是否正确，从而知道 Alice 确实是通过 r 和 a 计算得出的 z，但是又不暴露 r 与 a 的值。
还有，在协议第一步中产生的随机数 r 保证了 a 的保密性。因为任何一个秘密当和一个符合「一致性分布」的随机数相加之后的和仍然符合「一致性分布」。

看懂了这个图就看懂了 !!!!!

是 Sigma 零知识证明的一个特例

Schnorr 的非交互式版本

Schnorr 协议的非交互式版本可以避免 Prover 与 Verifier 的交互，但这要求 Prover 使用哈希函数，这样他就无法预测哈希函数的输出，非交互式版本的验证器实现非常简单，因为它不需要随机数生成器

(Making the protocol non-interactive)

首先定义: $a$ 是 $s k$ 即私钥 ; $P K$ 是 Public key 即公钥 ; $g^{a} = P K$

Prover 生成一个随机数 $r$ 并创建一个承诺 $co mm = g^{r}$ , Prover 对 $g 、 co mm 、 P K$ 进行哈希处理以获得挑战值 $c$ , $c = ha s h (g, P K, co mm)$
Prover 创建对挑战的响应 $s = r + c * a$ , 然后将元组 (comm, s) 发送给验证者。

$P ro v er g e n er a t e {co mm s = r + c * a$

Verifier 自己计算 $c^{'} = H a s h (g, P K, co mm)$ , 然后验证 :

$g^{s} g^{r + c * a} = ? P K^{c^{'}} + co mm = ? P K^{c^{'}} + g^{r} = ? g^{a \cdot c^{'}} + g^{r} (∵ P K = g^{a}, a i s s k) = ? g^{r + a \cdot c^{'}}$

如果 Verifier 自己验证这个等式相等, 则 Prover 就通过 $r + a \cdot c$ 这种方式隐藏了私钥 $a$ , 同时又能让对方确信自己真的有这个私钥 $a$ .

The prover generates a random number r and creates a commitment com = gʳ. The prover hashes g, com and y to get challenge c. c = Hash(g, y, t).
The prover creates a response to the challenge as s = r + c*x. The prover sends tuple (t, s) to the verifier.

The verifier now generates the same challenge c as Hash(g, y, t) and again checks if gˢ equals yᶜ.t. Python code demonstrating this protocol.

Schnorr 的问题

对不同的消息, 如果不幸选了相同的随机数 $r$ 私钥就会泄露

如果 Alice 在两次交互过程中使用了同一个 K，那么 Bob 可以通过发送两个不同的 c 和 c' 来得到 s 和 s'，然后通过下面的公式算出私钥 a：

s  = (c +a*e)/k , 
s' = (c'+a*e)/k , 两式相减, 求出 k 

k = (c - c')/(s - s')
a = (k * s - c)/e

ECDSA

Bitcoin 和 ETH 都支持 ECDSA signature.

why need ECDSA?

除了显而易见的“我需要对一份文件/合同进行签名”，还有一个非常流行的应用场景：让我们以一个不想自己的数据被用户修改或者破坏的应用程序为例，比如一个只允许你载入官方地图和不可修改的模块的游戏，或者一部只允许你安装官方应用程序的手机或其它设备。

在这些案例当中，相关文件（应用程序、游戏地图、数据等）会用 ECDSA 进行签名，公钥会随应用程序/游戏/设备一起捆绑并用来验证签名来确保数据没有被修改，而私钥在本地一个私密的地方进行保存。由于你可以用公钥对签名进行验证，但是不能用它创建或者伪造新的签名，你可以无所顾忌地将公钥随应用程序/游戏/设备一起分发。

这与AES相比，区别是显而易见的。AES加密系统允许你对数据进行加密，但是你需要用密钥来解密，这就要求你将密钥与应用程序一起捆绑，破坏了对数据进行保护防止数据被用户修改的目的。

一个很好的例子就是PS3的控制台，它被大量的破解，所有的文件可以解密，所有的密钥可以从解密的文件当中抽取，但是为了能够在最新的固件上面运行程序，你还需要破解一个ECDSA的数字签名。

当你想要对一个文件进行签名的时候，你会用这个私钥 / 随机数 / 文件的哈希组成一个魔法数学方程，这将给出你的签名。签名本身将被分成两部分，称为 R 和 S

选择随机数 $k \in F_{r}$ , 计算承诺 : $R = k^{-} 1 \cdot G$
挑战 : 取 $R$ 的横坐标为 $r = R_{X} (mod F_{r})$ (先 mod $F_{p}$ , 再 mod $F_{r}$ )
响应 : $s := k \cdot (m + r \cdot x) (mod F_{r})$

为了验证签名的正确性，你只需要公钥（用私钥在曲线上面产生的点）并将公钥和签名的一部分 S 一起代入另外一个方程，如果这个签名是由私钥正确签名过的数字签名，那么它将给出签名的另外一部分 R 。

$R^{'} := (s^{- 1} \cdot m) \cdot G + (s^{- 1} \cdot r) \cdot P K$

简单来说，一个数字签名包含两个数字，R 和 S，然后你使用一个私钥来产生 R 和 S ，如果将公钥和 S 代入被选定的魔法数学方程给出 $R^{'}$ , 且 $R == R^{'}$ 的话，这个签名就是有效的。仅仅知道公钥是无法知道私钥或者创建出数字签名。

Algorithm

初始化：椭圆曲线生成元为 $G$ ，标量域为 $F_{r}$ ，基域为 $F_{q}$

基域理解为椭圆曲线点的横纵坐标的取值范围 标量域 即做倍点运算的标量的取值范围, 比如 $P K = x \cdot G$ 里的 $x$ , 其不会超过椭圆曲线的阶 $q$

密钥生成：私钥 $x \in F_{r}$ 和公钥 $P K = x \cdot G$

签名: 输入任意消息 $M$ ，计算 $m := H a s h (M) (mod ∣ F r ∣)$

选择随机数 $k \in F_{r}$ , 计算承诺 : $R = k^{-} 1 \cdot G$
挑战 : 取 $R$ 的横坐标为 $r = R_{X} (mod F_{r})$ (先 mod $F_{p}$ , 再 mod $F_{r}$ )
响应 : $s := k \cdot (m + r \cdot x) (mod F_{r})$ ( k 增加了 ECDSA 的难度)

则签名为 $(r, s)$

$k^{- 1}$ 是 $k$ 的乘法逆元

我们是如何对一个文件或者一个信息进行签名的呢？

你需要知道签名本身是 40 字节，由各20字节的两个值来进行表示，第一个值叫作 $R$ ，第二个叫作 $S$ 。
值对 $(R, S)$ 放到一起就是你的 ECDSA 签名

验证 :

验证它，也非常的简单，你只需要 [公钥] 和导出这个公钥的曲线参数就可以了。你用以下方程来计算 $R^{'}$ ：

Verifier :

输入消息 $M$ , 计算 $m := H a s h (M)$
校验 $r, s \in F_{r}$
计算

$R^{'} := (s^{- 1} \cdot m) \cdot G + (s^{- 1} \cdot r) \cdot P K$

取 $R^{'}$ 的横坐标为 $r^{'} = R_{X}^{'} (mod F_{r})$ , 校验等式 $r == r^{'}$ : 如果相等, 则接受 , 否则拒绝

公式推导过程如下:

$R^{'} = (s^{- 1} \cdot m) \cdot G + (s^{- 1} \cdot r) \cdot P K = (s^{- 1} \cdot m) \cdot G + (s^{- 1} \cdot r \cdot x) \cdot G = (s^{- 1} \cdot (m + r x)) \cdot G = k^{- 1} \cdot G = R$

这里知道 $k$ 还是可以推算私钥, 所以 EIP-32 要求 : $k = H a s h (s k, m ess a g e, co n t e n t)$

EdDSA

以太坊 BN256 曲线已经支持了 EdDSA

EdDSA 正是为了解决 Schnorr 签名私钥泄露的问题 : 他不是选择随机数, 而是计算随机数

初始化 : 椭圆曲线生成元为 $G$ , 阶为 $q$ 密钥生成 : 私钥为 $x$ , 公钥为 $P K = x \cdot G$

签名：消息为 $m$ ，计算随机数 $r = ha s h (x, m)$ **，计算承诺 $R = r \cdot G$ ，

计算挑战 $e := ha s h (R, P K, m)$

计算响应 $s := (r + e \cdot x) mod q$

签名为(R,s)

验证：重新计算挑战 $e := ha s h (R, P K, m)$ ，然后校验 $s G == R + e \cdot P K$

与 ECDSA 最大的区别在于 $r$ 是算出来的, 没有使用随机数这样产生的签名结果是确定性的，即对同一消息, 签名结果相同, 不会额外泄露信息

一般说来随机数是安全措施中重要的一种方法，但是随机数的产生也是安全隐患，著名的索尼公司产品 PS3 密钥泄露事件，就是随机数产生的问题导致的 (写死在了代码里, 晕)。

zk-SNARK

在聊 zk-SNARKs 之前, 首先来看 NARK(Non-interactive ARgument of Knowledge) :

C : 电路 Circuit
$x$ : 公开声明 public statement
$w$ : $secre t$ witness
预处理(Preprocessing) 也称为 Setup, 它以电路的描述作为输入,然后输出这些公开参数,我们称之为 $pp$ 和 $v p$ :
$pp$ 表示公开的参数,供证明者使用。
$v p$ 表示公开的参数,供验证者使用。

证明者和验证者各自会输入 :

prover takes the $x$ (public statement) & $pp$ (public (circuit)params) & the Witness
Verifier takes $v p$ & $x$ (public statement)

然后,证明者试图向验证者证明: It knows some $w$ such that $C (x, w) = 0$

NARK Definition : A pre-processing NARK is a triple $(S, P, V)$ , where :

$S (C) \to$ generate the Circuit’s $pp & v p$ as public params for P & V.
$P (pp, x, w) \to$ : proof $π$
$V (v p, x, π) \to$ : $A cce pt$ or $R e j ec t$

所有算法和对手都可以访问 随机预言机 (random oracle)

zk-SNARKs 条件是苛刻的, 因为要让 Verifier 在如此短的时间内完成某些验证, 我们需要一些新的方法来去处理计算, 比如多项式承诺 (polynomial commitment)

(To be continued …)

Reference :

Vitalik ZK_Snark zk-learning Lectures 安比 zk-snarks https://vitalik.ca/general/2021/01/26/snarks.html Zero Knowledge Proofs with Sigma Protocols

从代码中学习 Plonk 协议

写作本文的目的主要是希望从代码的角度理解 Plonk 协议。因为我是开发者，之前读文章遇到公式感觉比较抽象，所以希望有这样的文章，可以从代码的角度来阐述 ZKP 的协议是如何工作的。

这篇文章对应的源代码在这里，主要实现了 Plonk 协议的核心概念，需要结合郭宇老师的 Plonk 系列文章阅读。

流程

通过测试 test.py 看到验证 Plonk 协议主要分为以下几个部分：

Setup
Program
Assignment
Generate proof
Verify

def prover_test():
    print("Beginning prover test")
    # powers should be 2^n so that we can use roots of unity for FFT
    # and should be bigger than len(coeffs) of polynomial to do KZG commitment
    # the value here is: powers = 4 * group_order
    # which is bigger than the order of quotient polynomial
    group_order = 8
    powers = group_order * 4
    setup = Setup.generate_srs(powers)

    program = Program(["e public", "c <== a * b", "e <== c * d"], group_order)
    assignments = {"a": 3, "b": 4, "c": 12, "d": 5, "e": 60}
    prover = Prover(setup, program)
    proof = prover.prove(assignments)
    print("Prover test success")
    return setup, proof, group_order

def verifier_test(setup, proof, group_order):
    print("Beginning verifier test")
    program = Program(["e public", "c <== a * b", "e <== c * d"], group_order)
    public = [60]
    vk = setup.verification_key(program.common_preprocessed_input())
    assert vk.verify_proof(group_order, proof, public)
    print("Verifier test success")

整个协议的过程：

给定一个计算/电路/程序:

a * b = c
c * d = e
其中 e 是公开值

prover 选择特定的一组值 witness = (a, b, c, d, e)，这组值满足上面的约束条件
在保持 witness 不公开的前提下，prover 生成一个证明 proof, 可以证明 prover 知道 witness
verifier 验证 proof 的真实性

下面我们通过代码依次看看每个步骤都做了什么。

Setup

@dataclass
class Setup(object):
    #   ([1]₁, [x]₁, ..., [x^{d-1}]₁)
    # = ( G,    xG,  ...,  x^{d-1}G ), where G is a generator of G_1
    powers_of_x: list[G1Point]
    # [x]₂ = xH, where H is a generator of G_2
    X2: G2Point

    @classmethod
    def generate_srs(cls, powers: int):
        print("Start to generate structured reference string")
        # tau is a random number whatever you choose
        tau = 218313819403157342856071133

        # Initialize powers_of_x with 0 values
        powers_of_x = [0] * powers
        # powers_of_x[0] =  b.G1 * tau**0 = b.G1
        # powers_of_x[1] =  b.G1 * tau**1 = powers_of_x[0] * tau
        # powers_of_x[2] =  b.G1 * tau**2 = powers_of_x[1] * tau
        # ...
        # powers_of_x[i] =  b.G1 * tau**i = powers_of_x[i - 1] * tau
        powers_of_x[0] = b.G1

        for i in range(powers):
            if i > 0:
                powers_of_x[i] = b.multiply(powers_of_x[i - 1], tau)

        assert b.is_on_curve(powers_of_x[1], b.b)
        print("Generated G1 side, X^1 point: {}".format(powers_of_x[1]))

        X2 = b.multiply(b.G2, tau)
        assert b.is_on_curve(X2, b.b2)
        print("Generated G2 side, X^1 point: {}".format(X2))

        assert b.pairing(b.G2, powers_of_x[1]) == b.pairing(X2, b.G1)
        print("X^1 points checked consistent")
        print("Finished to generate structured reference string")

        return cls(powers_of_x, X2)

    # Encodes the KZG commitment that evaluates to the given values in the group
    def commit(self, values: Polynomial) -> G1Point:
        if (values.basis == Basis.LAGRANGE):
            # inverse FFT from Lagrange basis to monomial basis
            coeffs = values.ifft().values
        elif (values.basis == Basis.MONOMIAL):
            coeffs = values.values
        if len(coeffs) > len(self.powers_of_x):
            raise Exception("Not enough powers in setup")
        return ec_lincomb([(s, x) for s, x in zip(self.powers_of_x, coeffs)])

    # Generate the verification key for this program with the given setup
    def verification_key(self, pk: CommonPreprocessedInput) -> VerificationKey:
        return VerificationKey(
            pk.group_order,
            self.commit(pk.QM),
            self.commit(pk.QL),
            self.commit(pk.QR),
            self.commit(pk.QO),
            self.commit(pk.QC),
            self.commit(pk.S1),
            self.commit(pk.S2),
            self.commit(pk.S3),
            self.X2,
            Scalar.root_of_unity(pk.group_order),
        )

这里有几个函数，第一个函数 generate_srs 用于生成 structured reference string(SRS)，用于给多项式在群上生成 KZG commitment。基本流程：

选择一个随机数作为 tau 的值
从椭圆曲线上获得两个生成元 G1 和 G2，有现成的函数库可以拿到
生成所需要的 SRS 值
最后对生成的值进行验证

第二个函数 commit，就是实际用来生成 KZG commitment 的函数

第三个函数 verification_key 用来给 verifier 生成 verification key，用来验证 proof

Program

program = Program(["e public", "c <== a * b", "e <== c * d"], group_order)

Program 类的目标是 Arithmetization，将某种计算转换成数学表示。这里的计算指的是一段电路，数学表示指的是多项式。

在 Plonk 中，可以用八个多项式来表示这个 Program: QL, QR, QM, QO, QC, S1, S2, S3。所以 Program 类的主要目标就是处理上面电路的字符串的表示，最终得到这八个多项式。这八个多项式是公开的，prover 和 verifier 都可以得到这个信息。

经过一定的处理，prover 得到 prover key(pk)。

@dataclass
class CommonPreprocessedInput:
    """Common preprocessed input"""

    group_order: int
    # q_M(X) multiplication selector polynomial
    QM: Polynomial
    # q_L(X) left selector polynomial
    QL: Polynomial
    # q_R(X) right selector polynomial
    QR: Polynomial
    # q_O(X) output selector polynomial
    QO: Polynomial
    # q_C(X) constants selector polynomial
    QC: Polynomial
    # S_σ1(X) first permutation polynomial S_σ1(X)
    S1: Polynomial
    # S_σ2(X) second permutation polynomial S_σ2(X)
    S2: Polynomial
    # S_σ3(X) third permutation polynomial S_σ3(X)
    S3: Polynomial

verifier 得到 verification key，在上面的 Setup 步骤中也提到了。

    # Generate the verification key for this program with the given setup
    def verification_key(self, pk: CommonPreprocessedInput) -> VerificationKey:
        return VerificationKey(
            pk.group_order,
            self.commit(pk.QM),
            self.commit(pk.QL),
            self.commit(pk.QR),
            self.commit(pk.QO),
            self.commit(pk.QC),
            self.commit(pk.S1),
            self.commit(pk.S2),
            self.commit(pk.S3),
            self.X2,
            Scalar.root_of_unity(pk.group_order),
        )

和 prover 不一样的是，为什么中间 8 个值要用 commitment 的形式发给 verifier 呢？这是因为 Plonk 协议为了保证 verifier 端验证的计算复杂度尽量低，所以没有给出原始的多项式，而只给出了 KZG 承诺的值，后面会看到，verifier 通过 pairing 验证就可以保证这些承诺值和原始的多项式是一一对应的，prover 欺骗不了 verifier，这样既保证的正确性，也保证了 verifier 验证的简单性。

Assignment

assignments = {"a": 3, "b": 4, "c": 12, "d": 5, "e": 60}

Assignment 是对电路中引线的赋值，也叫 witness 或者 private input。这些值只有 prover 知道，对 verifier 是保密的。prover 最终要向 verifier 提供证明，保证将这些值输入到 program 中能得到指定的结果。

Generate proof

proof = prover.prove(assignments)

这里是协议的重点，分为五轮。

主体逻辑：

    def prove(self, witness: dict[Optional[str], int]) -> Proof:
        # Initialise Fiat-Shamir transcript
        transcript = Transcript(b"plonk")

        # Collect fixed and public information
        # FIXME: Hash pk and PI into transcript
        public_vars = self.program.get_public_assignments()
        PI = Polynomial(
            [Scalar(-witness[v]) for v in public_vars]
            + [Scalar(0) for _ in range(self.group_order - len(public_vars))],
            Basis.LAGRANGE,
        )
        self.PI = PI

        # Round 1
        msg_1 = self.round_1(witness)
        self.beta, self.gamma = transcript.round_1(msg_1)

        # Round 2
        msg_2 = self.round_2()
        self.alpha, self.fft_cofactor = transcript.round_2(msg_2)

        # Round 3
        msg_3 = self.round_3()
        self.zeta = transcript.round_3(msg_3)

        # Round 4
        msg_4 = self.round_4()
        self.v = transcript.round_4(msg_4)

        # Round 5
        msg_5 = self.round_5()

        return Proof(msg_1, msg_2, msg_3, msg_4, msg_5)

通过 5 轮的计算会生成必要的 proof，这些 proof 之后交给 verifier 进行验证，如果通过，则整个协议完成。

Round 0: 初始化：

    def __init__(self, setup: Setup, program: Program):
        self.group_order = program.group_order
        self.setup = setup
        self.program = program
        self.pk = program.common_preprocessed_input()

Round 1: 生成对 witness/assignments 多项式的承诺

这个过程和相关知识可以参考理解 PLONK（一）：Plonkish Arithmetization 和理解 PLONK（二）：多项式编码。多项式承诺相关知识可以参考理解 Plonk（五）：多项式承诺

大体流程:

根据 group_order 初始化 A, B, C 这三个 witness 多项式的点值 A_values，B_values，C_values，这些点值用于后面生成多项式，也就是生成的 Polynomial 类
依次读取 program 中引线的值，将左引线的值 L 添加到 A_values, 右引线的值添加到 B_values 中，输出引线的值添加到 C_values 中
通过 Polynomial 类生成 A，B，C 多项式
生成 A，B，C 多项式的 KZG 承诺
验证门约束等式是否成立

    def round_1(
        self,
        witness: dict[Optional[str], int],
    ) -> Message1:
        program = self.program
        setup = self.setup
        group_order = self.group_order

        if None not in witness:
            witness[None] = 0

        # 1. 根据 group_order 初始化 A, B, C 多项式的点值
        # A_values，B_values，C_values，这些点值用于后面
        # 生成多项式，也就是 `Polynomial` 类
        # Compute wire assignments
        A_values = [Scalar(0) for _ in range(group_order)]
        B_values = [Scalar(0) for _ in range(group_order)]
        C_values = [Scalar(0) for _ in range(group_order)]

        # 2. 依次读取 program 中引线的值，将左引线的值 L 添加到 A_values, 
        # 右引线的值添加到 B_values 中，输出引线的值添加到 C_values 中
        for i, gate_wires in enumerate(program.wires()):
            A_values[i] = Scalar(witness[gate_wires.L])
            B_values[i] = Scalar(witness[gate_wires.R])
            C_values[i] = Scalar(witness[gate_wires.O])

        # 3. 通过 `Polynomial` 类生成 A，B，C 多项式
        self.A = Polynomial(A_values, Basis.LAGRANGE)
        self.B = Polynomial(B_values, Basis.LAGRANGE)
        self.C = Polynomial(C_values, Basis.LAGRANGE)

        # 4. 生成 A，B，C 多项式的 KZG 承诺
        a_1 = setup.commit(self.A)
        b_1 = setup.commit(self.B)
        c_1 = setup.commit(self.C)

        # 5. 验证门约束等式是否成立
        # Sanity check that witness fulfils gate constraints
        assert (
            self.A * self.pk.QL
            + self.B * self.pk.QR
            + self.A * self.B * self.pk.QM
            + self.C * self.pk.QO
            + self.PI
            + self.pk.QC
            == Polynomial([Scalar(0)] * group_order, Basis.LAGRANGE)
        )

        return Message1(a_1, b_1, c_1)

Round 2: 生成 Permutation Accumulator 多项式 Z 的 KZG 承诺

参考文章理解 PLONK（三）：置换证明

要给 Z 生成承诺，首先要构造Z，然后可以直接对多项式生成 KZG 承诺。

大体流程：

初始化Z 的点值数组 Z_values 第一个值为 1
在 group_order 内，依次用上一次的值乘以当前的累乘因子，获得当前 Z_values 的值
确保最后一项为 1（具体原理请看上面的文章）
检查生成值的有效性
用 Lagrange 形式构造多项式
生成 KZG 承诺

    def round_2(self) -> Message2:
        group_order = self.group_order
        setup = self.setup

        Z_values = [Scalar(1)]
        roots_of_unity = Scalar.roots_of_unity(group_order)
        for i in range(group_order):
            Z_values.append(
                Z_values[-1]
                * self.rlc(self.A.values[i], roots_of_unity[i])
                * self.rlc(self.B.values[i], 2 * roots_of_unity[i])
                * self.rlc(self.C.values[i], 3 * roots_of_unity[i])
                / self.rlc(self.A.values[i], self.pk.S1.values[i])
                / self.rlc(self.B.values[i], self.pk.S2.values[i])
                / self.rlc(self.C.values[i], self.pk.S3.values[i])
            )
        assert Z_values.pop() == 1

        # Sanity-check that Z was computed correctly
        for i in range(group_order):
            assert (
                self.rlc(self.A.values[i], roots_of_unity[i])
                * self.rlc(self.B.values[i], 2 * roots_of_unity[i])
                * self.rlc(self.C.values[i], 3 * roots_of_unity[i])
            ) * Z_values[i] - (
                self.rlc(self.A.values[i], self.pk.S1.values[i])
                * self.rlc(self.B.values[i], self.pk.S2.values[i])
                * self.rlc(self.C.values[i], self.pk.S3.values[i])
            ) * Z_values[
                (i + 1) % group_order
            ] == 0

        Z = Polynomial(Z_values, Basis.LAGRANGE)
        z_1 = setup.commit(Z)
        print("Permutation accumulator polynomial successfully generated")

        self.Z = Z
        return Message2(z_1)

其中 rlc 的定义：

    def rlc(self, term_1, term_2):
        return term_1 + term_2 * self.beta + self.gamma

Round 3: 生成商多项式的承诺

相关知识可以参考文章理解 PLONK（四）：算术约束与拷贝约束

大体流程:

构造消失多项式(Vanishing Polynomial): ZH_coeff
构造电路的门约束多项式: gate_constraints_coeff
构造 Copy Constraints 的多项式: permutation_grand_product
构造 Copy Constraints 第一个值为 1 这个约束的多项式: permutation_first_row_coeff
求出商多项式 quotient polynomial: T_coeff
计算商多项式的 KZG 承诺

    def round_3(self) -> Message3:
        group_order = self.group_order
        setup = self.setup

        # Compute the quotient polynomial

        alpha = self.alpha

        roots_of_unity = Scalar.roots_of_unity(group_order)

        A_coeff, B_coeff, C_coeff, S1_coeff, S2_coeff, S3_coeff, Z_coeff, QL_coeff, QR_coeff, QM_coeff, QO_coeff, QC_coeff, PI_coeff = (
            x.ifft()
            for x in (
                self.A,
                self.B,
                self.C,
                self.pk.S1,
                self.pk.S2,
                self.pk.S3,
                self.Z,
                self.pk.QL,
                self.pk.QR,
                self.pk.QM,
                self.pk.QO,
                self.pk.QC,
                self.PI,
            )
        )

        L0_coeff = (
            Polynomial([Scalar(1)] + [Scalar(0)] * (group_order - 1), Basis.LAGRANGE)
        ).ifft()

        # x^8 - 1 coeffs are [-1, 0, 0, 0, 0, 0, 0, 0, 1]
        # which needs 9 points(n + 1) to determine the polynomial
        ZH_array = [Scalar(-1)] + [Scalar(0)] * (group_order - 1) + [Scalar(1)]
        ZH_coeff = Polynomial(ZH_array, Basis.MONOMIAL)

        gate_constraints_coeff = (
            A_coeff * QL_coeff
            + B_coeff * QR_coeff
            + A_coeff * B_coeff * QM_coeff
            + C_coeff * QO_coeff
            + PI_coeff
            + QC_coeff
        )

        normal_roots = Polynomial(
            roots_of_unity, Basis.LAGRANGE
        )

        roots_coeff = normal_roots.ifft()
        # z * w
        ZW = self.Z.shift(1)
        ZW_coeff = ZW.ifft()

        for i in range(group_order):
            assert (
                self.rlc(self.A.values[i], roots_of_unity[i])
                * self.rlc(self.B.values[i], 2 * roots_of_unity[i])
                * self.rlc(self.C.values[i], 3 * roots_of_unity[i])
            ) * self.Z.values[i] - (
                self.rlc(self.A.values[i], self.pk.S1.values[i])
                * self.rlc(self.B.values[i], self.pk.S2.values[i])
                * self.rlc(self.C.values[i], self.pk.S3.values[i])
            ) * ZW.values[
                i % group_order
            ] == 0

        permutation_grand_product_coeff = (
            (
                self.rlc(A_coeff, roots_coeff)
                * self.rlc(B_coeff, roots_coeff * Scalar(2))
                * self.rlc(C_coeff, roots_coeff * Scalar(3))
            )
            * Z_coeff
            - (
                self.rlc(A_coeff, S1_coeff)
                * self.rlc(B_coeff, S2_coeff)
                * self.rlc(C_coeff, S3_coeff)
            )
            * ZW_coeff
        )

        permutation_first_row_coeff = (Z_coeff - Scalar(1)) * L0_coeff

        all_constraints = (
            gate_constraints_coeff
            + permutation_grand_product_coeff * alpha
            + permutation_first_row_coeff * alpha**2
        )

        # quotient polynomial
        T_coeff = all_constraints / ZH_coeff

        print("Generated the quotient polynomial")

        W_t = setup.commit(T_coeff)

        self.A_coeff = A_coeff
        self.B_coeff = B_coeff
        self.C_coeff = C_coeff
        self.S1_coeff = S1_coeff
        self.S2_coeff = S2_coeff
        self.S3_coeff = S3_coeff
        self.Z_coeff = Z_coeff
        self.ZW_coeff = ZW_coeff
        self.QL_coeff = QL_coeff
        self.QR_coeff = QR_coeff
        self.QM_coeff = QM_coeff
        self.QO_coeff = QO_coeff
        self.QC_coeff = QC_coeff
        self.PI_coeff = PI_coeff
        self.T_coeff = T_coeff

        return Message3(W_t)

Round 4: 对各个多项式在一个随机的 zeta 点求值

相关知识可以参考文章理解 PLONK（四）：算术约束与拷贝约束

这一步比较简单，对各个多项式在一个随机的 zeta 点求值。这里有一个知识点，就是如何获取 zeta 这个随机值，使用的方法叫做Fiat-Shamir 变换，可以将一个需要 prover 和 verifier 进行交互的证明转化成不需要交互的证明，简单介绍可以参考这篇文章，代码可以参考这里。

    def round_4(self) -> Message4:
        group_order = self.group_order
        zeta = self.zeta

        a_eval = self.A_coeff.coeff_eval(zeta)
        b_eval = self.B_coeff.coeff_eval(zeta)
        c_eval = self.C_coeff.coeff_eval(zeta)
        s1_eval = self.S1_coeff.coeff_eval(zeta)
        s2_eval = self.S2_coeff.coeff_eval(zeta)
        s3_eval = self.S3_coeff.coeff_eval(zeta)
        root_of_unity = Scalar.root_of_unity(group_order)
        z_eval = self.Z_coeff.coeff_eval(zeta)
        zw_eval = self.Z_coeff.coeff_eval(zeta * root_of_unity)
        ql_eval = self.QL_coeff.coeff_eval(zeta)
        qr_eval = self.QR_coeff.coeff_eval(zeta)
        qm_eval = self.QM_coeff.coeff_eval(zeta)
        qo_eval = self.QO_coeff.coeff_eval(zeta)
        qc_eval = self.QC_coeff.coeff_eval(zeta)
        t_eval = self.T_coeff.coeff_eval(zeta)

        self.a_eval = a_eval
        self.b_eval = b_eval
        self.c_eval = c_eval
        self.ql_eval = ql_eval
        self.qr_eval = qr_eval
        self.qm_eval = qm_eval
        self.qo_eval = qo_eval
        self.qc_eval = qc_eval
        self.s1_eval = s1_eval
        self.s2_eval = s2_eval
        self.s3_eval = s3_eval
        self.z_eval = z_eval
        self.zw_eval = zw_eval
        self.t_eval = t_eval

        return Message4(
            a_eval,
            b_eval,
            c_eval,
            ql_eval,
            qr_eval,
            qm_eval,
            qo_eval,
            qc_eval,
            s1_eval,
            s2_eval,
            s3_eval,
            z_eval,
            zw_eval,
            t_eval
        )

coeff_eval 是一个多项式求值的函数。具体实现可以看这里。

Round 5: 对每个多项式生成 KZG 承诺中需要的两个承诺

相关知识可以参考文章理解 PLONK（四）：算术约束与拷贝约束。

这一步也比较简单，生成所需的 KZG 承诺，为 verifier 进行 verify 做准备。

    def round_5(self) -> Message5:
        W_a, W_a_quot = self.generate_commitment(self.A_coeff, self.a_eval)
        W_b, W_b_quot = self.generate_commitment(self.B_coeff, self.b_eval)
        W_c, W_c_quot = self.generate_commitment(self.C_coeff, self.c_eval)
        W_ql, W_ql_quot = self.generate_commitment(self.QL_coeff, self.ql_eval)
        W_qr, W_qr_quot = self.generate_commitment(self.QR_coeff, self.qr_eval)
        W_qm, W_qm_quot = self.generate_commitment(self.QM_coeff, self.qm_eval)
        W_qo, W_qo_quot = self.generate_commitment(self.QO_coeff, self.qo_eval)
        W_qc, W_qc_quot = self.generate_commitment(self.QC_coeff, self.qc_eval)
        W_s1, W_s1_quot = self.generate_commitment(self.S1_coeff, self.s1_eval)
        W_s2, W_s2_quot = self.generate_commitment(self.S2_coeff, self.s2_eval)
        W_s3, W_s3_quot = self.generate_commitment(self.S3_coeff, self.s3_eval)
        W_z, W_z_quot = self.generate_commitment(self.Z_coeff, self.z_eval)
        W_zw, W_zw_quot = self.generate_commitment(self.ZW_coeff, self.zw_eval)
        W_t, W_t_quot = self.generate_commitment(self.T_coeff, self.t_eval)

        print("Generated final quotient witness polynomials")
        return Message5(
            W_a, W_a_quot,
            W_b, W_b_quot,
            W_c, W_c_quot,
            W_ql, W_ql_quot,
            W_qr, W_qr_quot,
            W_qm, W_qm_quot,
            W_qo, W_qo_quot,
            W_qc, W_qc_quot,
            W_s1, W_s1_quot,
            W_s2, W_s2_quot,
            W_s3, W_s3_quot,
            W_z, W_z_quot,
            W_zw, W_zw_quot,
            W_t, W_t_quot,
        )

生成承诺的代码:


    def generate_commitment(self, coeff: Polynomial, eval: Scalar):
        setup = self.setup
        zeta = self.zeta
        # Polynomial for (X - zeta)
        ZH_zeta_coeff = Polynomial([-zeta, Scalar(1)], Basis.MONOMIAL)
        quot_coeff = (coeff - eval) / ZH_zeta_coeff
        # witness for polynomial itself
        w = setup.commit(coeff)
        # witness for quotient polynomial
        w_quot = setup.commit(quot_coeff)
        return w, w_quot

Verify

再回顾一下测试中的代码是这样进行验证的:

def verifier_test(setup, proof, group_order):
    print("Beginning verifier test")
    program = Program(["e public", "c <== a * b", "e <== c * d"], group_order)
    public = [60]
    vk = setup.verification_key(program.common_preprocessed_input())
    assert vk.verify_proof(group_order, proof, public)
    print("Verifier test success")

VerificationKey 的代码在这里，最核心的方法是 verify_proof

verifier 主要做两件事情:

验证 KZG 承诺，保证多项式是和所承诺的一致
验证最终组合出来的多项式求值的相等性

    def verify_proof(self, group_order: int, pf, public=[]) -> bool:
        # 4. Compute challenges
        beta, gamma, alpha, zeta, v, u = self.compute_challenges(pf)
        proof = pf.flatten()

        # 5. Compute zero polynomial evaluation Z_H(ζ) = ζ^n - 1
        ZH_ev = zeta**group_order - 1

        # 6. Compute Lagrange polynomial evaluation L_0(ζ)
        L0_ev = ZH_ev / (group_order * (zeta - 1))

        # 7. Compute public input polynomial evaluation PI(ζ).
        PI = Polynomial(
            [Scalar(-x) for x in public]
            + [Scalar(0) for _ in range(group_order - len(public))],
            Basis.LAGRANGE,
        )
        PI_ev = PI.barycentric_eval(zeta)

        # verify KZG10 commitment
        self.verify_commitment(proof, proof["W_a"], "W_a_quot", "a_eval", zeta)
        self.verify_commitment(proof, proof["W_b"], "W_b_quot", "b_eval", zeta)
        self.verify_commitment(proof, proof["W_c"], "W_c_quot", "c_eval", zeta)
        self.verify_commitment(proof, proof["W_z"], "W_z_quot", "z_eval", zeta)
        self.verify_commitment(proof, proof["W_zw"], "W_zw_quot", "zw_eval", zeta)
        self.verify_commitment(proof, proof["W_t"], "W_t_quot", "t_eval", zeta)
        self.verify_commitment(proof, self.Ql, "W_ql_quot", "ql_eval", zeta)
        self.verify_commitment(proof, self.Qr, "W_qr_quot", "qr_eval", zeta)
        self.verify_commitment(proof, self.Qm, "W_qm_quot", "qm_eval", zeta)
        self.verify_commitment(proof, self.Qo, "W_qo_quot", "qo_eval", zeta)
        self.verify_commitment(proof, self.Qc, "W_qc_quot", "qc_eval", zeta)
        self.verify_commitment(proof, self.S1, "W_s1_quot", "s1_eval", zeta)
        self.verify_commitment(proof, self.S2, "W_s2_quot", "s2_eval", zeta)
        self.verify_commitment(proof, self.S3, "W_s3_quot", "s3_eval", zeta)

        a_eval = proof["a_eval"]
        b_eval = proof["b_eval"]
        c_eval = proof["c_eval"]
        ql_eval = proof["ql_eval"]
        qr_eval = proof["qr_eval"]
        qm_eval = proof["qm_eval"]
        qo_eval = proof["qo_eval"]
        qc_eval = proof["qc_eval"]
        s1_eval = proof["s1_eval"]
        s2_eval = proof["s2_eval"]
        s3_eval = proof["s3_eval"]
        z_eval = proof["z_eval"]
        zw_eval = proof["zw_eval"]
        t_eval = proof["t_eval"]

        f_eval = (
            (a_eval + beta * zeta + gamma)
            * (b_eval + beta * zeta * 2 + gamma)
            * (c_eval + beta * zeta * 3 + gamma)
        )
        g_eval = (
            (a_eval + beta * s1_eval + gamma)
            * (b_eval + beta * s2_eval + gamma)
            * (c_eval + beta * s3_eval + gamma)
        )

        gate_constraints_eval = (
            ql_eval * a_eval
            + qr_eval * b_eval
            + qm_eval * a_eval * b_eval
            + qo_eval * c_eval
            + qc_eval
            + PI_ev
        )

        permutation_grand_product_eval = z_eval * f_eval - zw_eval * g_eval

        permutation_first_row_eval = L0_ev * (z_eval - 1)

        left = (
            gate_constraints_eval
            + alpha * permutation_grand_product_eval
            +  alpha ** 2 * permutation_first_row_eval
        )

        right = t_eval * ZH_ev

        assert left == right

        print("Done equation check for all constraints")
        return True

    # Compute challenges (should be same as those computed by prover)
    def compute_challenges(
        self, proof
    ) -> tuple[Scalar, Scalar, Scalar, Scalar, Scalar, Scalar]:
        transcript = Transcript(b"plonk")
        beta, gamma = transcript.round_1(proof.msg_1)
        alpha, _fft_cofactor = transcript.round_2(proof.msg_2)
        zeta = transcript.round_3(proof.msg_3)
        v = transcript.round_4(proof.msg_4)
        u = transcript.round_5(proof.msg_5)

        return beta, gamma, alpha, zeta, v, u

    def verify_commitment(self, proof, W, W_quot_key, eval_key, zeta):
        W_quot = proof[W_quot_key]
        eval = proof[eval_key]
        ec_comb = ec_lincomb(
            [
                (W, 1),
                (W_quot, zeta),
                (b.G1, -eval),
            ]
        )

        assert b.pairing(self.X_2, W_quot) == b.pairing(b.G2, ec_comb)
        print(f"Done KZG10 commitment check for {eval_key} polynomial")

最后

以上就是 Plonk 协议的代码讲解，接下来建议读者亲自运行一下这个代码，打印其中一些值看看，这样会对协议的了解更加深刻。

Last update: 2023-10-23 ¹

📢 Feel free to contribute! Pls fork zkp-co-learning.github.io and PR!

PS: In each title’s Content Block, the top part is newer, below is older.

ZKP building blocks

Cryptography

《公钥密码学研究方法论》[https://documents.uow.edu.au/~fuchun/methodology.html]

这是 slides，这是最新的本体： [https://eprint.iacr.org/2023/715
密码学纯理论进展速度也同样相当的惊人，
清华毕业的Yanyi Liu跟着Rafael Pass 揪着OWF不放疯狂输出，试图彻底搞清楚密码学的复杂性理论基础。
Yilei Chen回国后负责清华姚班的Cryptography课 http://www.chenyilei.net/cryptography-s2023.html，下一代姚班选手的ZKP就都是他教的了，他在FS要不要密码学哈希，iO/lattice方面也有很多工作。
Lijie Chen就更不用说了，华人TCS之光，博士论文写了551页https://www.mit.edu/~lijieche/Lijie-Chen-thesis.pdf，已经是average-case hardness 和 derandomization领域世界级的专家了，可以去预测哪年得图灵奖了。

Curves

The Pasta Curves for Halo 2 and Beyond
Mina Book: Pasta Curves
Pallas and Elliptic Curves
A survey of elliptic curves for proof systems
Revisiting cycles of pairing-friendly elliptic curves
Pairings in Rank-1 Constraint Systems
https://github.com/zcash/pasta_curves
https://hackage.haskell.org/package/pasta-curves-0.0.1.0/docs/PastaCurves.html
https://github.com/nccgroup/pasta-curves
https://docs.rs/ark-pallas/0.3.0/ark_pallas/

Math.

Probability and Measure https://www.youtube.com/playlist?list=PL0vEWJI_pj7RZ51zecINlzWxpFv83r8RE 还有这个，我快看完了，超喜欢

Abstract Algebra I (full course) https://www.youtube.com/playlist?list=PL1r259iKOz-lJ0TjURlrUVASXQimpWAS5
The-Art-of-Linear-Algebra
Animation vs. Math

Succinct Proofs and Linear Algebra

数学 :

参考学习内容:多项式乘法和除法、拉格朗日插值、Schwartz-Zip-pel 引理、快速傅立叶变换(FFT) 、NTT、MSM 以及 Field extension等。
An Introduction to Mathematical Cryptography
https://explained-from-first-principles.com/number-theory 这个介绍数论的也不错

初等数论和群论 :

推荐了 MIT’s 6.875 (Foundations of Cryptography) ，对于国内的同学来讲，建议结合潘承洞版的看，会更好！教材链接：https://mit6875.github.io/HANDOUTS/numbertheory.pdf

Rust

https://github.com/evcxr/evcxr/tree/main/evcxr_jupyter yeah, a Jupyter kernel for Rust

cargo install evcxr_jupyter
evcxr_jupyter --install
jupyter lab

ZKP Basics Tutorials

这个课也值得跟上： PSE Lectures - A full course on Elliptic Curve Cryptography https://www.youtube.com/playlist?list=PLV91V4b0yVqQ_inAjuIB5SwBNyYmA9S6M

新火公开课 https://space.bilibili.com/3493266041342842/channel/series 钟博的课

https://www.rareskills.io/zk-bootcamp
https://zkhack.dev/whiteboard/ 挺适合作为基础资料的
https://www.rareskills.io/zk-book

I try not to recommend too many sources, since everyone learns differently. But here are a few:

Least Authority’s Moonmath manual for learning Snarks. Starts with the basics.
For learning about Starks, StarkWare’s Stark 101 series.
For writing some ZK code and seeing what actually happens: Noir from Aztec
a16z 整理的比较全的 ZKP 的资料库 https://a16zcrypto.com/zero-knowledge-canon/
ZK 零知识: https://buidlerdao.notion.site/ZK-5963083942a744bbb60a0328008868e2
零基础学习 ZK: https://mirror.xyz/searchblock.eth/y11EKtXAtK3aXRVMV1yYqw7FibKHxI0fK10vlVRDaD4
万字长文捕获 ZK Rollup 时代价值｜ZONFF Research: https://mp.weixin.qq.com/s/5zKdS-GL8w_z4XIDOjv7FA
zksync开源

怎么零基础学习零知识证明:

https://mirror.xyz/searchblock.eth/y11EKtXAtK3aXRVMV1yYqw7FibKHxI0fK10vlVRDaD4

Awesome ZKP

Nova / Folding schemes

nova 写的五子棋: https://www.zkconnect4.dev/

Nova 项目: https://github.com/microsoft/Nova/network/dependents

A Brief History of Folding Schemes https://arc.net/e/2831196C-9575-47A6-966E-B34DB840168E

Bootleproof-type IPA是「folding 前史」的一章

https://nova-browser-ecdsa-web.vercel.app/

Folding with ProtoGalaxy - Liam Eagen https://www.youtube.com/watch?v=SpkTvRia1EA

Nova: A New Chapter in Zero-Knowledge Proofs (medium这糟糕的排版)

Benchmark on recursion Plonky vs Nova https://github.com/nikkolasg/recursive-bench

白菜: 有对NOVA-ML 感兴趣的不，这个课题可能比较大，可以考虑组个支队了 😂

https://github.com/socathie/nova-ml
awesome-zkml : https://github.com/worldcoin/awesome-zkml
Team Novi (Nova): https://0xparc.notion.site/Team-Novi-2d81bc06b0aa4c99b61a9ee06166b3b6
risc0-nova
- https://github.com/hero78119/risc0-nova
Parallelizing Nova
Nova: A New Chapter in Zero-Knowledge Proofs (medium这糟糕的排版)

Halo2

https://github.com/CPerezz/halo2_sumcheck 👀

https://github.com/axiom-crypto/halo2-wasm

https://github.com/zkCert/halo2-zkcert

0xPARC Course Recordings, Slides, and Notes

Taiko: https://github.com/taikoxyz/circuit-tools/tree/main

我们从 PSE 的 zkevm 里抽象出了一个 sdk，大家如果想用 halo2 开发可以试下 [Grin] 欢迎给我提 issue

solidity verifier: https://github.com/privacy-scaling-explorations/halo2-solidity-verifier/pulls

halo2 tinyram https://github.com/Orbis-Tertius/tiny-ram-halo2

Poseidon: https://github.com/zcash/halo2/blob/main/halo2_gadgets/src/poseidon/pow5.rs
proof of validator: https://github.com/asn-d6/halo2-merkle-tree-ipa-bench
social recovery: https://hackmd.io/@Nerolation/H1BvRWg02

axiom 的 open source program

使用了 halo2 的 Applications:

ZK Email https://github.com/zkemail halo2
ZK Wordle: https://zordle.xyz/ halo2
Hammster： https://github.com/ytham/hammster halo2
zk-draw : Verifiable random draw with zero-knowledge of the random seed https://github.com/jae-cuz/zk-draw halo2
ZK Microphone: https://github.com/Miyamura80/ZKMicrophone
Building a Zero Knowledge web app with Halo 2 and Wasm (part 1)
zk-img: Fighting Deepfakes with Zero-Knowledge Proofs https://medium.com/@danieldkang/zk-img-fighting-deepfakes-with-zero-knowledge-proofs-9b76c23e3789 尚未开源

大部分由 @Kurt Pan 博士整理

STARK

深入探索STARK的安全性和可靠性——STARKs全面安全分析 https://blog.csdn.net/mutourend/article/details/133821797

A Walk-Through of a Simple zk-STARK Proof
Boojum：zkSync的高性能去中心化STARK证明系统 https://blog.csdn.net/mutourend/article/details/131770996
一个非常简洁的stark介绍，比vitalik版本更加适合初学者:
- Zero Knowledge Virtual Machine step by step https://eprint.iacr.org/2023/1032.pdf
https://github.com/aszepieniec/stark-brainfuck/blob/master/docs/engine.md
- 老外写个一个简单版本的zkvm，不过是基于stark的
- 并且也配有文档，适合研究基于stark zkvm的原理理解。

@0xhhh: 总结了下 Stark的一些资料，很多来自于@Kurt Pan ，感谢潘老师:

https://www.notion.so/Stark-Cannon-0801f24ea9e543449e015bf4063bb71d?pvs=4
https://literate-wolfsbane-bf0.notion.site/Stark-Cannon-0801f24ea9e543449e015bf4063bb71d?pvs=4

Kurt Pan : https://github.com/erhant/zkbrainfuck A Brainfuck zkVM with Circom.

https://starkware.co/stark-101/ @Frank Jz Liu 推荐，亲测很不错

再推荐这几个，你可以去整理一下： https://aszepieniec.github.io/stark-anatomy/ https://aszepieniec.github.io/stark-brainfuck/ https://github.com/facebook/winterfell https://github.com/lambdaclass https://github.com/andrewmilson/ministark/

https://github.com/aszepieniec/stark-brainfuck/blob/master/docs/engine.md
- 老外写个一个简单版本的zkvm，不过是基于stark的
- 并且也配有文档，适合研究基于stark zkvm的原理理解。

实现一个 Baby Snark

可以参考 https://github.com/initc3/babySNARK 。可以看到Andrew Miller，Ye Zhang这些大佬几年前也是这么一步步成长起来的

@Maxlion🦁 提供：

Cairo 环境配置➕ERC 实现（Cairo1） https://starknetastro.xlog.app/Starknet_Shanghai_Workshop_DAY1

Cairo 语言中文文档 https://book.cairo-lang.org/zh-cn/index.html

开发工具版本号推荐湘_Xiang 版本 https://w3hitchhiker.notion.site/Starknet-cc07119ed57648faa92f7630219225b3?pvs=4 鸦_Cryptonerdcn 版本 https://docs.google.com/document/d/1ehBfE2CBeVL9rDhSc_JiUtxZJKWVKl8A6o1f1Ee0X4M/mobilebasic

[Cairo合约示例] Nethermind 版 https://starknet-by-example.voyager.online/ LambdaClass 版 https://cairo-by-example.com/ OpenZeppelin 版 https://github.com/OpenZeppelin/cairo-contracts/tree/cairo-2

Starknet 文档 https://book.starknet.io/

Starknet 基金会给 Astro 社区开发者的答疑文档 https://docs.google.com/document/d/1ku_y4M9PUe_GcwiBlvq6Kz2LkagyXD2Za1XCZj-IHVo/mobilebasic

Starknet 中文知识库(生态向) https://starknet-astro.super.site/

ZKML

Zator: Verified inference of a 512-layer neural network using recursive SNARKsv

TensorPlonk: A “GPU” for ZKML, Delivering 1,000x Speedups https://medium.com/@danieldkang/tensorplonk-a-gpu-for-zkml-delivering-1-000x-speedups-d1ab0ad27e1c

https://github.com/worldcoin/awesome-zkml
https://github.com/socathie/circomlib-ml
https://github.com/socathie/nova-ml
https://github.com/lyronctk/zator

ZKML slides： https://www.canva.com/design/DAFi3o7FiR4/d9LMeacr6QQwYy9C0BQHgA/view

这篇 ZKML 文章很顶: https://mirror.xyz/sevenxventures.eth/3USbrj7kcK7lyq_7upA4iyWV5pWMII7KrM40z5zpEXo

zkVM

https://github.com/vacp2p/zk-explorations

对不同 lib 和 algo 实现的 VM 做的性能测试 benchmark

发现了asz有好多好东西啊，stark很好的学习资料 https://github.com/aszepieniec/stark-anatomy

下一期共学STARK+zkVM的资料

https://neptune.cash/ STARK 算法解析（第 6 部分: 加速整个流程） https://asz.ink/alan-szepieniec/ he is an advisor to Nervos Foundation. https://neptune.cash/ https://neptune.cash/learn/brainfuck-tutorial/

snarkVM: Aleo 已经把 Marlin 更新成 Varuna 了 varuna

徒手写 zkVM - https://eprint.iacr.org/2023/1032.pdf

ZERO KNOWLEDGE VIRTUAL MACHINE STEP BY STEP
稍微比较偏理论
https://github.com/aszepieniec/stark-brainfuck/blob/master/docs/engine.md
- 老外写个一个简单版本的zkvm，不过是基于stark的
- 并且也配有文档，适合研究基于stark zkvm的原理理解。

另外他去年一篇zkvm的概览，对理解zkvm的设计还是很棒的。他是指 https://aszepieniec.github.io/stark-brainfuck/ 的作者？

基本的输入输出，内存等。我一直认为那个教程就是最好的zkvm入门的。

https://github.com/cryptape/ckb-bf-zkvm 秘猿 A BrainFuck zkVM implementation on CKB, using Halo2. 一个只有几条指令的 vm 机器

snarkVM有啊，Aleo家的就是 https://github.com/AleoHQ/snarkVM。没记错底层proof sys用的Marlin。
- 可能program execution是面向冯诺伊曼架构RAM模型，而AIR相比于电路抽象层次更高，设计STARK VM更直接，所以大多数项目会这么选吧。
- 不过zkEVM都用SNARK堆出来了，同样的工程师去堆一个自定义ISA的VM对他们来说应该是个simpler task吧

Nova VM 来了, 看不过来了。。。。

Towards a Nova-based ZK VM

我在找一个write a vm from scratch的课程

要是只是vm不要求zkvm那就太多了，比如5天前的这篇 https://andreabergia.com/blog/2023/07/i-have-written-a-jvm-in-rust/

上周测试了一下 PSE evm circuit，生成的 raw proof 用 evm 验证需要大约 4000万+ gas。（本地调高了 block gas limit）也测试了 scroll-prover 的 chunk proof，evm 验证大概需要 40万+ gas。感觉 gas fee 这块至少有 100 倍的以上的提升

chunk proof 里面包涵了 2次压缩，还是做了不少的工作

不太确定上面的代码是不是具体的电路，看了下感觉没多少行。[Facepalm]

zkevm super circuit 的 column 太多了，应该超过了 1000 个。 chunk 和 aggregation 的 column 少了很多，但是应该像 Frank 所说，电路 “平铺”在聚合电路里。不知道他们怎么优化到 40万 gas 的，这个水平已经和 circom 差不多了

cutting-edge

Lattice

Lattice-based cryptography: The tricky math of dots https://www.youtube.com/watch?v=QDdOoYdb748&list=PLMItfTVgwEAvTX4-sZkcF5s3-l1JDocY0&index=4

Quantum

Quantum Resistance and the Signal Protocol

Signal 已经集成 Kyber了

ZK Applications

ZK Email

最近有进展，确实值得研究：ZK Email https://github.com/zkemail

ZK Proof of Email：通往decentralized identity之路 https://blog.csdn.net/mutourend/article/details/129004763?ops_request_misc=&request_id=2425a5a6d21c4b6bbe440828ba478ccf&biz_id=

zkWASM

Exploring alternatives to WASM for smart contracts

一个华人团队搞的 zkwasm

https://github.com/DelphinusLab/zkWasm
另一个zkwasm - supernova, 估计9-10月发布
- https://twitter.com/powdr_labs/status/1679822931340173313
- https://twitter.com/HoumanShadab/status/1679155719805755392

【zkwasm 分享总结】： 
程序泡在 webassembly 的 bytecode 里面。是一个 webassenmbly 的小程序。
不分链游的问题：游戏运行的结果有可能作弊，不知道你是怎么运行这个程序的，有可能你上传了一些裸数据。 所以仍依靠中心化的服务器

会在跑 webassembly 的时候跑一个，监听用户事件，产生输入输出的 sequence，把他编译成一个 webassembly 的文件。每个操作带来的 consequence 会被管控的，把 proof 上链。

how to generate proof：
- Prover 实例
- 不用每次都和链上交互（gas 太高），可以把本次所有的行动都压成一个 proof。

https://github.com/DelphinusLab/zkWasm

如果想 onchain Verify，需要 Deploy 一个测试合约

合约生成，prove 加速：
- https://github.com/DelphinusLab/continuation-batcher

https://hackmd.io/@sinka/BJUIyufEc

后续：模块化公开课

PSE

From CEX to CCEX with Summa https://mirror.xyz/privacy-scaling-explorations.eth/_1Y6ExFD_Rs3oDxwx5_kWAj_Tl_L9c0Hm7E6SVJei0A

https://mirror.xyz/privacy-scaling-explorations.eth/f2ZfkPXZpvc6DUmG5-SyLjjYf78bcOcFeiJX2tb2hS0

PSE Lectures - Ep 6 https://www.youtube.com/watch?v=l7bEN1V7qRM

Meeting PSE Slides
PSE Projects List : https://www.appliedzkp.org/projects
Make your first contribution to any open-source Web3 project : https://www.useweb3.xyz/contribute
LIST： https://www.appliedzkp.org/projects

Some Project Boards:

Proof of Innocence（清白证明）：

https://github.com/chainwayxyz/proof-of-innocence
Twitter : Follow @drCathieSo_eth @AndyGuzmanEth

Tricks & Tools

https://github.com/joelparkerhenderson/sha256-sentence

The SHA256 for this sentence begins with seven, seven, f, zero, a, b, b and five.
The SHA256 hash of this message begins with 534d765
我去，厉害了,主要是里面没有什么随机数

https://zkbench.dev/ trade-offs and performance of different frameworks.

A survey of ZK Languages

books & websites & Podcasts..🎙📚

https://blog.lambdaclass.com/ 要经常看

https://blog.csdn.net/mutourend – 简中唯一zkp-complete博客[Grin]

订阅下 mutourend 邹老师的csdn，这技术热点追踪翻译速度才叫快，“区块链媒体”们望尘莫及😂
去年出版的《哥德尔传》 https://book.douban.com/subject/36073022/ 是我近些年读到写得最好的传记，
仅次于我十年前读到的《维特根斯坦传》 https://book.douban.com/subject/6152040/ （这是不可能被撼动的第一传记神作）
The arithmetic of pairing-based proof systems

三本叙事书籍 : pnp / tns / cw

https://cryptography.rs/ 这个页面很全也很漂亮，我cryptography.land也是受这里启发

刚才CJ还提到了这个网站 https://asecuritysite.com/ ，我也经常看这个，可以感到这个教授对密码学是真爱，做得非常全面且扎实

🎙 老牌密码学播客： Security Cryptography Whatever https://securitycryptographywhatever.com/ Episode 288: Quantum Cryptography with Or Sattath

zkp info flow

https://twitter.com/i/spaces/1ynJOaMnBlOKR

zkp twitter space 202309201217 https://www.proofoftrack.xyz/ 还有Suning的newsletter，小伙子精力旺盛，新link整理得很快

郭老师推： https://twitter.com/1dot2 邹老师博： https://blog.csdn.net/mutourend 论文看我的这个： https://zk.cryptography.land/ zkmesh: https://zkmesh.substack.com/ 自定义Twitter Threads：比如我这个 https://twitter.com/i/lists/1522499398210531329 项目方的博客（这个很多，看几篇看对不对胃口，调整） Youtube：PSE/a16z/Eth Global etc podcast: https://zeroknowledge.fm/

以上所有内容（包括Twitter List）均可RSS订阅，且建议使用RSS订阅

项目程序一手信息几乎唯一的选择：Github 论文的话 https://eprint.iacr.org/ 又想起来这个重要的标准化组织（很少被提起但里面有好东西）： https://zkproof.org/ 比如 https://docs.zkproof.org/presentations 沙漏老师的feed : https://github.com/PrimitivesLane/PrimitivesFeed 一个中科院数学所的学生做的密码学链接聚合网 https://link.fffmath.com/ 泛web3终极聚合器RAW： https://twitter.com/nake13/status/1526852356402745346

forum: https://ethresear.ch/ https://zkresear.ch/

Interdisciplinarity(e.g. AI)

AI:

Others (can’t archive)

当时逐字听译的一个 Brendan 的 talk: Plonky2 简介 https://mp.weixin.qq.com/s/qSWFLQPQJvWHclAvlEXEaQ

Q: 我想知道这个 recursive 实际能跑起来的例子哪里有[Lol] A: Plonky2-based的吗？olavm肯定能实际跑起来 https://github.com/Sin7Y/olavm

Eos: Efficient Private Delegation of zkSNARK Provers

Lurk Beta 估计还得半年以上 https://github.com/lurk-lab/lurk-rs/issues/657

ABCDE ZK Hacker Camp |【Session 8: Efficient Zero-KnowledgeProofs: Theory and Practice】 https://www.youtube.com/watch?v=j2_9nwgfhEw

https://anoma.github.io/VampIR-Book/
zk 摩尔定律: zkintro
@Qi Zhou : 话说，我们在做zkWASM的Cannon，也计划用各种foding + aggregate的方案，感兴趣的小伙伴可以报名😄
risc0-nova
- https://github.com/hero78119/risc0-nova
zkGeth, 看起来是把 geth 转化成risv64指令集，然后做一个zkrisc出来。
- https://hackmd.io/@HqESr6_rQbmdCj2v03vrcQ/HyMA2pkmh
Towards a Nova-based ZK VM 的作者开始写的新书 :
- zkintro

网上有比较好的用bellperson或者bellman写 zkp的例子吗？

具体一点我觉得lurk的Poseidon 实现里有不错可以借鉴的 https://github.com/lurk-lab/neptune/blob/main/src/sponge/circuit.rs
因为Nova用的是relaxed r1cs所以你也可以直接参考nova的examples比如 https://github.com/microsoft/Nova/blob/main/examples/minroot.rs , Constraint 部分都是一样的
想找一些bellman 入门介绍快速上手，目前看到的最详细的就是 https://electriccoin.co/blog/bellman-zksnarks-in-rust/ 了
仍然记得sinka（高老师）说学习框架最好写一个排序，当时他用的是halo2
Foundations of Data Availability Sampling
Boojum Upgrade: zkSync Era’s New High-performance Proof System for Radical Decentralization

https://slush.dev/ tendermint + Cairo vm 定制L3 as service https://0xparc.org/blog/parc-squad 这个有点意思

关于 20 年以后 zk 的综述, pan 老师有推荐吗 :

20年以后形势就是社区为王，不少好东西先发hackmd了。综述当然也有不少，但都是更细分领域的了，比如 https://eprint.iacr.org/2023/671 ， https://eprint.iacr.org/2023/857 等等

（发现和另一个研究群人员不overlap再发一遍）过了一遍HyperNova和Customizable constraint systems，感觉这个工作非常让人兴奋。CCS用来统一R1CS AIR PLONKish，然后用Nova IVC的方式multi-folding生成SNARK。有一种ZK界LLVM的即视感。各位老师怎么看。

zkp QA

Question Lists:

zkp 的前端？后端？算数化？
什么是 MSM 加速？
P!=NP ?
SumCheck 没有办法转成非交互式的zk 证明吧？

zkp 的前端？后端？算数化？我感觉应该是后端需要@Kurt Pan 给出一个前端后端的定义

https://a16zcrypto.com/posts/article/measuring-snark-performance-frontends-backends-and-the-future/

有两种解释：

前端=算术化/后端=证明系统
前端=密码学编译器（比如多项式承诺）/后端=信息论证明系统（比如IOP）

什么是 MSM 加速？

以groth16为例，涉及7次NTT：4个INTT ，5次msm：其中1次G2的MSM 。整体Prover消耗上，MSM应该占据了70%多吧. NTT应该占据10-20%。

P!=NP

刚郭老师说有人想听关于P vs NP问题的内容，这里刚好有一篇很新超棒的科普文章。我明天10:30可以给大家过一下这篇文章：
https://www.quantamagazine.org/complexity-theorys-50-year-journey-to-the-limits-of-knowledge-20230817/

“If you believe in hardness, then you should believe that it’s hard to prove hardness,” “why it had been so hard to prove that this seemingly hard problem about computational hardness was actually hard”

“which intuitively seem harder and thus are perhaps easier to prove hard.”

“complexity theory is itself complex” 看完了，这篇过于震撼

研究PRG，研究succinctness，研究NIZK，研究secret sharing，这些密码学研究全都反过来都跟证明P不等于NP密切相关。再反过来又可以做到直接基于P不等于NP假设（而不是存在单向函数）的密码学。

- https://www.quantamagazine.org/the-cryptographer-who-ensures-we-can-trust-our-computers-20230727/
- https://www.quantamagazine.org/a-short-guide-to-hard-problems-20180716/
- [P vs. NP and the Computational Complexity Zoo](https://www.youtube.com/watch?v=YX40hbAHx3s)
- https://www.quantamagazine.org/complexity-theorys-50-year-journey-to-the-limits-of-knowledge-20230817/


单向函数存在（P不等于NP），则存在对NP的ZKP；单向函数不存在（且P=NP），则也存在对NP的ZKP。

前半句是GMW86原话。后半句：如果P=NP，又因为对P永远存在无条件的ZKP system，所以也存在无条件的对NP的证明系统。

所以ZKP恰恰是少数无论P是否等于NP都存在的密码学协议。OTP也是。还有所有的「信息论安全密码学」。而大多数需要单向函数的密码协议，都活在Minicrypt之后。

这个才是需要展开说说的。但上次随便一讲都讲了两个半小时，还只讲了一条线，耽误大家吃饭都[Facepalm]

所以是不是可以理解为，只要有P问题的存在，就存在密码学协议
我不知道密码学协议的定义，所以没法讨论

对P问题的零知识证明系统trivial的无条件存在，这个证明系统就一个特点：完全无视prover

赶紧学lattice吧

请教大家一个问题，SumCheck 没有办法转成非交互式的zk 证明吧？

如果不强调非交互可以看这篇 https://arxiv.org/pdf/1704.02086.pdf 如果强调非交互，就要小心绕过一个结论：一个零知识的public coin的交互式协议是不能应用Fiat-Shair转换为非交互的，soundness不能保证。

这句话难懂，pan老师这个有文章说明么

例子应该是 Barak01 的 non-blackbox simulation里的协议。上次Deng Yi老师讲的就是说过早达到 zk 性质对 fs 并非好事

我的理解在 sumcheck 中，每一轮需 verifier 提供随机数给 prover，prover 计算 $g_{i} (x)$ 并发给verifier，这个计算 $g_{i} (x)$ 的过程 verifier 做不了，所以必须要交互

没有让verifier做prover工作的。转非交互的思路是把verifier的工作（发随机数）让prover做（用哈希）。
非交互这个词也不好，非交互不是没有交互，而是单向一轮交互
在 sumcheck 的 step3 Verifier checks that the partial sum and total sum agree when the partial sum is evaluated at 0 and 1 and its outputs added。
按照 https://semiotic.ai/articles/sumcheck-tutorial/ 中的描述只有verifier 验证partial sum 和total sum 的结果才能发送随机数

¹ 巨量资料 FYI，大部分出自网络及群聊整理，时间有限出处没有做细致排版，请恕无法极尽详实覆盖，如需加上出处请联系作者 ~

经验心得

郭宇：ZK 技术的学习心得和经验分享

演讲：郭宇，安比实验室创始人兼 CEO

整理：Amber，Foresight News

今天我主要是跟大家分享一下关于 ZK 的学习心得和一点体会。因为在以太坊接下来的几个升级中，都包含了很多最新的 ZKP 或者是 zkSNARK 的技术。最近有很多人在学习这些知识，我们也参加了一些公学的小组，在这里深度讲一下其中很共性的问题。

Why ZKP or zkSNARK？

首先我们能感受到 ZK 的项目是很 FOMO 的，我更想从技术层面讲一下我们为什么要有 ZKP 和 zkSNARK。当然，它自身本来就是密码学里一个非常重要的分支，但我认为它在以太坊的发展过程中发现这个东西异常强大，包括 Vitalik 自身也做过一些布道的工作，所以说得到了非常长足的发展，也解决了以太坊未来的发展途径。

从最早期的 Sharding 发展到现在以 Rollup 为中心的新方向上，我认为 zkSNARK 或 ZKP 在其中起到了非常重要的作用。在我看来，首先它是「产生信任的机制」。比特币为我们带来的，像共识协、POW 协议和一些分布式算法，能够产生一些信任，但这种信任是有存在 51% 诚实的前提假设的。另一种是我在从事区块链相关研究之前，做了十几年的 formal logic 和 formal verification 的工作，本质上是通过 formal logic 保证代码的执行满足某种预期，但我认为这也是一种信任，只不过它的假设是通过逻辑系统本身的一致性去保证信任。ZKP 和 zkSNARK 是我第一眼看到的时候，就觉得和我研究了很长时间的领域不一样的信任创造方式，因为他们从另外一个角度，几乎正交地提供了另外一种创造信任的方式，就是通过交互进行概率性证明，同时提供信任。正如 Vitalik 所说，他们是正交于共识协议的另外一种非常重要的区块链核心技术。

第二点我觉得可能很少有人提到，但是我认为是非常重要的，就是可组合性。我们听到这个词大概是 19 年，以太坊还处在 DeFi 早期探索过程中的时候，大家提出来的概念。因为以太坊上的所有智能合约都部署在一个平台上，这些合约之间可以没有任何调用的障碍和壁垒，就像没有农田里没有横亘在里面的篱笆一样。正是这种可以无障碍调用的可组合性让 DeFi 有了现在这样的繁荣。虽然可组合性不是一个特定的编程语言，但它是一种更高维度的编程，是一种可编程的手段，本质上是更抽象的编程。其实在 zkSNARK 里，可组合性是肉眼可见的。且不用说最近两年 zkSNARK 技术本身的发展，当我们去看 paper 的时候，我们已经可以非常清晰地看到一个协议，是通过很多子协议的排列组合构造出来的，并且这种可组合性以肉眼可见的速度扩大，这也就意味着 zkSNARK 不再是我们想象中的某一种算法，比如 Groth16 或者 PlonK。它们本身也很复杂，拆开来看，每个算法都由一些精巧的小组件构成，这些精妙的算法之间又可以构成一个更大一点的协议，甚至比我的描述更加复杂，它不是严格的、有层级的划分，它甚至更灵活一些。

这些可组合性的发展、爆炸很有可能带来新的空间。而且这个空间能有多大？我觉得基本上可以说大到无法想象，尤其是最近一两年关于递归零知识证明技术的一些突破，带来了非常大的创新空间。而至于它是不是下一个「big thing」，我觉得冠上「之一」，可能是一个比较稳妥保守的说法，但我仍然觉得这是一个非常让人激动的领域，尤其是在 Blockchain 或 Crypto 的圈子之外，目前注意到的人还很少，因此我觉得这是非常好的机会。

说到体会，我先谈一谈我自己是如何入坑开始做 ZK 研究的。首先，我在 17 年买了很多 Zcash（ZEC），当然，从投资回报角度来看，这就是非常糟糕的一笔投资。但我觉得也正是这个举动让我深入地了解 zkSNARK，并不务正业地用业余时间读了一些东西，但我发现非常难懂。当时网上也很少这样的文章能作参考。同时当我去翻传统密码学的书时，也失望地发现几乎都没有提及到这类知识。

在一些国外的教材里面，可能在整个教科书的最后一章会花两三页讲解一下，就已经很不错了。但很幸运的是，我在 2017 年年底发现了 Dan Boneh 和 Victor Shuop 写的教材，虽然还没有完全写完，却已经出现了一部分关于 zkSNARK 的讲解。我觉得如获至宝，因为在资料很少的情况下，居然有一本书能从最简单的概念讲起，这本教材我认为是非常好的密码学入门教材。于是在 18 年的时候，我就开始慢慢读那本书，学习一些基本概念。

然后在 18 年年底到 19 年的一整年中，我们创立了安比实验室，早期我们一直在做 smart contract audit，去帮一些朋友解决智能合约的安全问题，但是我们同时还是用了大量的时间去学习基础的密码学知识。在 19 年我们开始着手做一个用于 data trading 的协议，叫做 zkPoD。20 年，我们讲之前的工作总结了一下并发表在了 CCS2021 上，也得到了一些密码学学者的帮助。而在 2021 年之后，因为整个密码学领域发展太快了，我们的很多想法跟不上整个领域的理论工具的发展速度，所以我们之前的工作就暂停了。那时候真的特别感慨，我们之前面临的很多技术困难，很快就会被人解决，甚至还有好多种解决办法，我们就不得不去看全这些解决方案，可能还没有完全理解，又有新的工具被创造出来。所以说我们这几年基本上都在不断学习，学习速度还远远赶不上创新的速度，说这是一个寒武纪大爆炸，我觉得一点都不夸张。我觉得它的威力可能不亚于 ChatGPT 对整个社会的影响，只是说现在还没有那么明显，没有特别杀手级应用出来，但我觉得这个是必然的。

另一点感想就是，在早期的时候，我们读的资料都是来源于学术界，来自于专门长期从事密码学理论研究的教授和专家学者的论文。但是从 2020 年往后，我们其实发现大量资料来源于工业界的工程师。因为在 Crypto 领域，大家迫切的想要使用密码学去解决 Blockchain 和 Crypto 中非常核心的问题，有些快速的工程应用甚至领先了理论的发展。我就举几个例子，首先是 Halo，Halo 最早是由 Zcash 团队创造出来的，然后学术界从中获得了启发发展出了 accumulation scheme，包括最新的在递归零知识证明里非常重要的技术。它最早的起点就是在工程实践中发现的一些一开始不起眼的一些小规律。

第二个就是 PlonKish Arithmetization，最早也是在工业应用领域从 Aztec 团队慢慢发展起来的，之前有很多 code，但是它真正的理论研究是后来逐步补上的。但现在为止基本上以 PlonKish Arithmetization 为主导的很多学术研究已经慢慢扩散开来了。很像我右边图上的几棵树，当然这几棵树我只是借用了 slides 中的，zkSNARK 就像一棵很大的树，并且在不断成长，于是就有了 zkEVM 和 zkVM 这样的概念。我经常感慨在 19 年，预想 zkEVM 或者 zkRollup 之类的概念，都要是 10 年之后才有可能出现的东西，因为在当时我们能感受到 zkSNARK 能做的应用是非常有限的。但是没想到这三年来，Halo 和 PlonKish 的发展能够让 zkEVM 基本上成为现实。这是非常恐怖的，包括像 Lookup Arugment 还有一些很有意思的技术，反过来对学术界都有很大的推动能力。

第三点就是这整个过程是非常愉悦的，不管里面遇到了多大的困难，或者是解决了一些小问题所带来的成就感，都让我们感到非常有趣。

我觉得绝大多数人对这个东西的印象就是特别难学的月球数学，但实际上从我们的经历来看其实也不是那样。

它其实要求的前置数学基础并不多，但它最难的部分其实是关键概念超级多，而且这些概念还在随着时间演化，也就是说你可能从别人嘴里听来了，或者在某个地方讲到的，或者是在一个文档里看到的东西，过了 3 年之后可能需要重新去审视它，它又可能表述都不一定准确，或者是它在表达另外一层意思。

第二个就是协议相对复杂，因为它属于密码学协议，可以说密码学这个分支，整个大方向上都是属于内部协议比较复杂的这类，于是它的形式化定义特别多。不同的学者去写形式化定义使用的符号体系也不尽相同，公式也是量多且复杂，即使背了也记不住，可能睡一觉醒来就忘。

第三点是，核心代码很短，但内部结构足够复杂，密码学有一个很有意思的点，就是你无法通过看代码去学习算法，因为你看他弄来弄去，都不知道他想干什么，还是需要一些理论的指引才能读懂代码。

第四点就是，很多朋友还是会按照论文上的算法去实现一遍，但能实现就证明真的懂了吗？这显然还是相去甚远的，这个我们会稍后讨论的。

零知识证明的学习曲线还是相对陡峭的，陡峭的原因并不在于 zkSNARK 或 ZKP 有多难，而是在于，首先开发工具很缺乏，也就是说想直观地体验一下并不容易，还需要做很多工作，去搜去看相关理论知识之后才能下手。第二就是学习资料其实更缺乏，现在跟 4 年前相比还是多了很多资料的，但要知道资料的增加速度远远赶不上创新的速度，也就是说有大量新的理论技术并没有被总结成文章，有的甚至都没有行文写下来，它们存在一些系统的角落里，或者说它只有代码但没有理论。因为是寒武纪大爆发，导致了学习资料相对更少，即便是需要的数学基础并不多，前置知识覆盖秒依然很广。所以有些朋友认为自己数学不好，并不是根本性问题。还有一点是论文挺难看懂的，这是我在早期学习时的感触，有些套路需要慢慢适应。

一些心得和经验

下面想给各位朋友再讲一些心得和经验。

首先给第一类想要快速入门的新手朋友，或者说看过一些非常简单的概念，无论出于哪种目的想要快速入门的朋友们。首先，有诀窍吗？诚实一点说时没有的，但确实可以把几个地方作为切入点。其一，写代码是一件很重要的事，这里的代码可以分很多种，我认为现在很多可用的 library 都是很不错的。比如 Circum，可以在网页端试着写一些电路代码。第二类的 Halo2，我认为如果想要深入学习的话，可以用 Rust 吗，Halo2 也恰好是 Rust 的一个 library，也是在社区中广泛使用的。现在以太坊基金会也在基于 Halo2 进行一些工作，可以去看一下这个 library，并根据它去写一些基础的 demo 或者例子。第三个是 Gnark，是 Consensys 开发的用 go 语言写的库。如果你对 Rust 不熟悉或者没有写过 Rust 的话，可以优先选择 Gnark，因为它是用 Golang 写的，上手更简单一些。最后，还有 zkSNARK 社区的 Cairo，虽然我自己没有写过 Cairo，但我已经看到不少人已经成功启动了，所以我认为 Cairo 的效果应该是不错的。

关于代码围绕什么去写，我认为可以基于 KZG 多样式承诺、IPA、Baby SNARK、Sumcheck 等非常简单的密码学协议，是可以做一些实现的。因为，实现了之后，可能会获得一些教科书上所不能提供的很直观的概念。比如，代码运行的速度，对稍大一点的例子电路是否能够正常使用，浏览器最大能承受的电路等等。

我觉得手动写代码这一方面，首先有助于大家理解很多概念，比如，到底什么是电路。相信不少朋友都听说过电路，就是挺难写的，如果动手写一下电路就会发现，它其实不算是在写正常的程序，而是在写一个证明过程，因为本身零知识证明就是一个证明过程，因此写电路其实就是写证明，而非写计算。写证明的过程有一些特定的套路和经验模式，这个需要慢慢熟悉和思考的。

第二个我觉得是有助于对运营效率有所感知，就是知道运行的速度能有多快，以及假如说你想去 build 一个应用，他大概能用在什么地方。比如说你在以太坊一层的合约里做一个电路的 verify，你大概需要多少 gas。事实上这些都是需要你实际操作完之后才能有的一个初步印象。

第三个就是对协议借口、协议流程有一个基础的了解和大概的感觉。

第四个就是你能对基础的数学原理有初步的认识，但不需要去学很多，不需要去重新找一本代数的书去翻，因为一本完整的教材包含太多内容了。我觉得通常情况下是没有必要的，但是可以通过 Google 或者 ChatGPT 去快速学习一下基础的数据原理。直接通过编程学习的话，感觉是完全不同的，特别是对于使用的参数、输出的结果，以及如何在代码中 encode，用什么样的数据结构，都会有非常直接的认识和理解。

这里我想要推荐 zkiap.com 的课程，它是一个注重实践的简单代码学习课程，每周花点时间就基本上可以慢慢明白是怎么一回事，推荐给所有能写代码的朋友们。

但有些朋友可能会问，假如说我不会写代码，或者说我没有时间写代码，但是我仍然想快速入门，那该怎么办呢。我认为第一点就是要准确地理解相关概念，所谓的准确理解就不是一些模模糊糊的理解，比如，我们说零知识有 zero-knowledge，那么到底什么是 knowledge？我觉得是需要搞很清楚的，这些关键概念搞得越清楚，看文章就会越顺利，包括还有像 witness 这种概念。还有像 Random Oracle 还有 Commitment 之类的概念。为了搞懂 Random Oracle 是什么，我前后可能花了一年时间去看各种东西，慢慢尝试理解，但但是的资料很少，我觉得现在的资料已经足够丰富了，已经有一些教科书能够吧这些概念讲的相当清楚了。然后还有一些概念，像 CRS、SRS 是什么，如何用 Polynomial IOP 做一些 plunk 应用。其次像 extractability 还有 preprocessing，这个适合具体应用开发相关的。我认为对这些基础概念有必要有非常精确的理解，如果不是很理解或者模糊的话，我的建议是先去看这些概念，Google 和 ChatGPT 能够在这里起到很大的作用。对于基本概念的掌握程度，我认为首先需要能看懂科普文章中的一些密码，一些黑话。

第二个是能够对 zkSNARK 有一个清晰的抽象的认识，也就是说能大概知道它是什么，能用一句话去讲一下什么是 zkSNARK，而不是只是将它描述为一个 library，或者用一个方式函数调用一下，或者说就是一段代码，真正的掌握是要比这些都再深入一层。第三个就是如果好奇的同学或者有更多时间的朋友可以去看一下学术论文，如果第一节能看懂的话，我觉得已经是相当不错了，这意味着很多密码学黑话都已经理解了。如果有一些频繁出现的黑话不理解，就可以去 Google 或者 ChatGPT 弄明白，有些实在很难懂了就可以先放一放。最后就是能初步理解 zkSNARK 的一些应用，如果能做到这一点的话，对一个不会写代码的人，已经是对 zkSNARK 已经又了相当深的认识了。

接下来我说的这一类朋友，他们不满足于一些基础概念的理解，始终对内部工作原理感到好奇，关于黑盒如何运行，为什么能 work，为什么能提供信任，他的信任又基于哪些东西，应用条件是什么，等等。我这边的建议是，需要先充分理解一个算法代码，就是先把一个算法吃透，其实非常重要。因为在算法之间就好比再学一个编程语言一样，如果 Java 用得很熟练了，再去切换到其他语言，其实并没有很复杂。前提是，这个语言需要用得特别熟练，如果只是浅浅地能写一些 Hello World，可能差距还比较大。我觉得可以先针对一个算法，比如说我觉得像 PlonK 是首选的，因为它比 Groth16 简单很多。PlonK 是我认为我见过的所有算法里最简单的，虽然 Groth16 的科普文章更多，但事实上它是一个复杂难懂的算法。然后还可以选择 zkSTARK，Marlin，Spartan，他们的对看论文的要求可能会更高一些。总之，我推荐先学 PlonK。

第二个就是去阅读一些 Github 上的开源代码，现在有非常非常多的有意思的项目，几乎每两三天都能发现一个很不错的开源项目，并且代码质量不错，我在这里就不给大家推荐了。

第三个点就是如果你想了解内部工作原理的话，你不可避免地要去理解这些公式，但对于初学者的最大问题是，公式无法理解或者并不能记住。我认为这里的核心窍门就是，多抄公式。不停地重复抄公式，同时再思考，在这个过程中就会有神奇的力量，能让人不知不觉中就明白了一些东西。

在这里推荐一个 MOOC，叫做 zk-learning.org，他们的课程深度不错，也会涉及到内部的工作原理，也会用非常简单的语言去抽象地解释一个或者一类算法是如何工作的。我认为如果能看懂并实现一个最简版本的代码并且能看懂 70% 的相关论文，且能不需要任何辅助地手推公式，并能够大致理解 Soundness 思路，我觉得已经达到了理解 zkSNARK 的要求了，但在这个阶段还是不要自行修改和优化协议，这是非常危险的动作，除非有非常多的经验，否则千万不要自行修改优化协议，因为密码学协议中有非常多没有写出来的东西。相关的反面教材有很多，我觉得最著名的就是 BCTV14，它是 14 年的一篇论文，他们的论文在做了一次修改优化之后出了一个 bug，然后修了 bug 之后又是一个 bug，而且都是非常严重的 bug，也就是说这些顶尖的密码学家都会犯这样的问题，那更不要说一个初学者。对初学者而言，你可以自己去设计一个协议，但是你一旦去修改别人的时候，你还要确保对这个东西有足够清晰的理解。

接下来对于更高阶的朋友，可能你是在 build 自己的项目，想用 ZK 去解决一些必要性的问题，需要自己设计协议。首先，我觉得你需要反反复复地读大量的论文。第二个就是需要补最基础的计算理论，而不是代数或者射影几何，或是那些数学概念。我觉得这里面其实最重要的是计算理论，我在这里推荐两本书，一本是《Computational Complexity: A Modern Approach》，另一本是《Computational Complexity: A Conceptual Perspective by Oded Goldreich》。第三点就是要跳出兔子洞，关注基本问题。因为有些算法还是很深、很烧脑的，有时候需要在一个非常小的细节卡上好几个月。但我觉得这里面的核心点是为了理解它为什么 work，有些时候你要跳到最外面来问一些最简单、最直接也最基础的问题，再去反思这个细节。就是你需要不断进到一个非常小的细节，同时又要不断地跳到外面去反复对比思考，这样就很容易弄懂这一点细枝末节的东西。第四个就是逆向思考，因为很多协议的设计是非常精巧的，有时候需要我们去理解而不是简单地 follow。但事实上理解又是一件很困难的事，多数情况下我在理解算法的过程中所用到的方法论是逆向思考，也就是说如果将原来的算法换成另外一种，又会产生怎样的效果。大多数情况下，它是不 work 的，那么它为什么不 work？这是很重要的。

最后，给大家说一下读论文的心得，因为论文确实比较难读，都是些非常学术的文章。第一，请务必反复仔细阅读论文第一节，因为论文第一节通常是论文最精华的部分，他通常描述了这篇论文最主要的贡献，包括他和前人的不同以及他的新协议或者新算法最重要的特点。通过读很多论文的第一节，能够快速找到一个知识网络。

第二点就是，你需要把论文的参考文献这几页，特地打出来，有助于形成一个知识网络，就可以沿着参考文献，找到更多的资料，而不单纯是通过 Google 或者 ChatGPT，而是通过这个论文所依赖的前置论文，形成一套理解体系。

第三点是要从历史的角度看概念的变迁、算法的演化和技巧的组合，这里面能发现非常非常有意思的故事。我觉得也可以找机会和大家分享一下，但这需要很多时间去准备。虽然密码学已经历经了 40 年的发展，但是从历史的角度看，它经过了一个非常快速的发展与变迁的过程。

第四点是，一篇论文需要反复看，大概看懂其中的 90%，需要好几个星期甚至好几个月。我最开始去学习这个东西的时候，一开始非常难受，非常有挫败感的一点是有篇论文我看了半年都还看不懂。但突然有一天，我看到一个密码学家他的分享里面说他看论文也是要几个星期才能看完，这时候我才如释重负，我才觉得原来他们也是这样。所以说一篇论文看不懂其实是非常正常的一件事。

第五个是，我认为参与社区讨论特别有用。

最后一点，找一个 Crypto 领域的问题点，找一个你觉得有意义的工作，然后 get hands dirty，这个能驱动你把关注点集中到一些点上面，更容易做出一些突破性的工作成绩。

对话姚翔：解读零知识证明的前世今生

https://daorayaki.org/post/63ec77b7d8c1277f21f6a8b1

作为互联网世界的最小单元，人们为了获得互联网所带来的便利，在参与线上的生活，工作，交易的过程中，不得不牺牲自己的隐私数据。例如在网站上输入信用卡号，向房屋中介提供自己的银行信用记录，向银行提供身份信息等，同时这也带来了各种各样的风险，例如身份信息的盗用，电子邮件泄露，数据泄露和其他形式的欺诈等。

而零知识证明的提出，正是为了解决这样的困境。它所具有的一系列先天优势，使其成为了各种区块链扩容和隐私解决方案的重要组成部分，从而让人们在不泄露任何自己隐私信息的情况下进行自身权益的认证。

鉴于零知识证明对于整个行业的未来发展起到至关重要的作用，DAOrayaki特别邀请了“原语里弄”的发起人姚翔老师，从密码学，隐私计算学实践者的角度，一起聊一聊如何看待并理解零知识证明。全文如下文所示。喜欢听音频的朋友，可点击播客：https://www.ximalaya.com/sound/560839397

Shaun：Hello，大家好，欢迎来到本期的Yaki叨叨！我是主持人Shaun。零知识证明作为计算机科学领域在近50年间最引人注目的创新之一，与EVM技术成为了当下web2向web3演化的两个重要入口，它提供了一种方便且实用的验证方法，使得web3的链外数据能够方便的取得链上验证，获得web3生态的信任，为数据资产的互通提供了可能。

鉴于零知识证明对于整个行业的未来发展起到至关重要的作用，Daorayaki社区认为有必要也有义务以行业资深研究者，观察者，分析者的角色向更广泛的受众群体普及零知识证明的相关知识。为此今天我们特别邀请了“原语里弄”的发起人姚翔老师，从密码学，隐私计算学实践者的角度，一起聊一聊如何看待并理解零知识证明，欢迎姚翔老师。

姚翔：大家好，我是姚翔，也是“原语里弄”的发起人。现在主要从事区块链包括密码学的相关研究，同时我们也举办一些线下的研讨活动，支持一些相关课题的研究，给予研究人员各种的帮助。

在启动“原语里弄”之前，我在金融机构工作了几年，然后在一家区块链初创公司开发智能合约钱包，我在Crypto领域大概也有七八年的时间了，我本人是密码学专业背景，虽然在工作后并没有从事太多的密码学研究，但是相关知识还有一些，所以应Shaun的邀请，来聊一聊零知识相关，我觉得也有必要做一些基础知识的普及，今天很高兴有机会和大家交流。

Shaun：谢谢姚翔老师，谦虚了。在深入展开零知识证明的探讨之前，我觉得追根溯源是难免的，所以我们一定会谈到那个不能“免俗”的问题：就是零知识证明的诞生背景是怎样的？或者说它的起源的故事是怎样的呢？有请姚翔老师。

姚翔：首先，零知识证明，并不是为了解决区块链的某个问题而提出的，但在近几年的发展过程当中，随着区块链的需求增加，随着这个行业吸引了更多的注意力，创造了更多的价值，零知识证明的发展速度，在近几年的时间里确实变快了。

但零知识证明的历史可以追溯到很远，如果以这个词的诞生或者这个概念的明确提出，来作为时间节点计算的话，至少也是在1985年的事情（将近40年），当时相关的论文提到了什么内容我会在后续说到。

我更想先从一个更贴近生活的角度，和大家去分享零知识证明的概念。相信大家看到零知识证明这个词，可能会在搜索引擎里面去搜索，搜索结果一般会给你一些案例，比如阿里巴巴坐到一个山洞里，他知道这里面能不能开门；再比如说三染色问题；如果用英文搜索的话，会有一个案例叫where’s waldo（寻找瓦尔多）。

但我们脱离干巴巴的教学，从生活经验出发。相信大家应该都参加过数学考试，数学考试都有证明题，证明题是什么呢，提供条件ABC，证明x=y或者其他结论。我们回想一下写下证明的这个过程，根据已知条件进行一些计算和推演，利用一些定理或公理写完这个证明，从考试的角度来说，证明的过程极其重要，这是判卷人给分的重要评判标准。那这里有一个很有趣的点在于，实际上判卷人不需要知道标准答案是什么（也就是不需要知道任何额外知识），因为根据提供的推演过程和题目中的已知条件，就可以验证你是否知道证明过程。

在这个例子中，存在两个角色，一个是证明者（Prover），也就是答卷人；还有一个就是验证者（Verifier），也就是判卷人。其次呢，证明者拥有某种知识，在这个例子中知识=证明过程，也就是答题内容。而验证者是不需要拥有这个知识的，看到证明过程随后就可以做出判断。

还有一点，证明的过程中，证明者和验证者没有对话，证明者写完证明，他就把卷子交上去了，而验证者看到这个证明，也不能再提什么问题（证明者也无法再回答任何问题），这在现今的语境下理解，就叫非交互。

还有一个很重要的问题，就是零知识证明中零知识的定义，在考试这个例子中，如果验证者（判卷人）之前不知道如何证明，但在读完一个人的完整证明过程（正确的前提下）之后，就知道（不需要去理解）如何证明了。或者说，在考试过程中，我看到前面人的证明过程，我发现是对的，不需要理解他是如何写出证明的（为什么这么证明），只需把它抄下来就可以。换言之，验证者在阅读证明过程之后，获得了额外的知识（即：一开始不会，在读完证明之后就会了）。

我想还有一个比较重要，但又有一些隐藏在里面的一个条件，就是这道题是有一点点难度的，它不是一个非常简单的题。因为如果这道题很简单，已知a=1，b=2，c=3，证明a加b等于c，那我们前面提到的，这种抄袭证明过程（或者说验证者获得额外信息）就不成立，因为这道题太简单了，验证者不需要去阅读证明者的答案，就知道如何证明。

那综上所述，我们提出了两个问题。第一个问题是：什么样的问题需要去证明；第二个是：有没有可能构造出一种证明，让验证者（判卷人）知道证明者（答卷人）有实际能力推演出证明过程，但验证者在过程中，不能学到如何去证明（或学习到如何伪造一个证明过程）。也就是当答卷人是证明者1，改卷人是验证者1，验证者1可以确认证明者1知道证明过程x，但是验证者1在验证后不能构造出一个证明（即证明过程伪x，甚至是证明过程x），让验证者2相信验证者1（此时他是证明者2）知道如何来证明。或许这个例子比较宽泛，不是非常精确，只是用一个更贴近生活的例子，尝试将大家带入这个语境。

而刚刚提到，在1985年（将近40年前），有三位学者，Goldwasser，Micali还有Rackoff发表了一篇论文，名字叫《交互式证明系统的知识复杂性》，标题中没有提到零知识证明，但在文章中有它的定义。文章中他们定义了一种交互式的证明系统，和刚才的例子有一个很大的区别在于，证明者和验证者之间，不是一次性的（证明者将东西交给验证者，随后验证者就做出判断）。而是有多轮的交互（证明者给验证者一个东西，随后验证者可以提问，然后证明者再给验证者一个东西，验证过程是多轮的），而同时这个证明系统允许有一些极小的误差，即证明者可能不知道这个题怎么证，有小概率可以欺骗验证者。文章中还提到了密码学上的一个常用的工具，叫不可区分性，来定义了零知识。

同时，我们刚才也提到：什么样的问题才需要去证明。这篇文章讨论的证明系统，针对的是NP问题，NP问题简单来说：是指多项式时间内，验证这个解是不是正确的问题。而现在人们普遍认为，P问题（多项式时间内可以解决的问题），和NP问题是否相等，这件事情仍然是不确定的。但我们仍倾向于P是不等于NP的，也就是说：存在一些问题，求解它是困难的，但是验证解的正确性是容易的。

所以我们就针对类似问题构造这种证明，可以理解成它存在一些不确定性：对于验证者来说，在多项式时间内，可以比较简单的验证它，但没有办法在多项式时间内找出它的解（即验证者不知道这个知识），这就是这篇文章中的一些核心观点。凭借这篇文章Goldwasser和Micali，包括第三作者Rackoff，获得了1993年的哥德尔奖，Goldwasser和Micali还获得了2012年的图灵奖。

一个题外话是，Goldwasser是一个以色列人，但她这个姓氏很有意思，这个词的词根意思是“金子的水”，也是一个很著名的金箔酒品牌，它诞生于现今波兰的格丹恩斯克，历史上也叫“但泽自由市”。如果去了解这个城市的历史，我觉得它和今天所描述的Crypto精神，也是有很多交织的部分。

所以正如刚刚提到的，零知识证明并不是为了解决区块链的问题提出的，它发生的很早，但是在近些年的过程中，确实是因为crypto世界的大量的需求推动了它的加速发展。

Shaun：谢谢姚翔老师的分享，前面我们聊到了零知识证明的起源，然后聊到了Crypto相关，那您作为这个行业的实践者之一，从您的角度出发，您觉得今天的零知识证明都主要应用在了Crypto里的哪些现实场景中呢？或者说它的出现为现今Crypto行业改变或带来的哪些东西呢？

姚翔：这个问题很好，大概十年前我在读书时，零知识证明在课上提到的时候，也只是一个比较简单的理论描述，看不到太多的实际应用，甚至当时的老师也觉得这个东西好像看上去挺有用，但是不知道怎么有用。

而随着Crypto技术的发展，零知识证明逐渐找到了自己的定位，有意思在于零知识证明和区块链（或者说分布式账本技术），其实是高度契合的。因为区块链解决的问题是：分布式网络对一个状态的共识，但关于状态的变化以及状态内容的保护做的还有欠缺。

现在的区块链，是由计算驱动的状态机，用以太坊为例，从S到S1’，它的变化是：知道S的状态，然后收到一笔Transaction（交易），计算后得到新的S1’，全网络的所有节点都要做这样的计算。而零知识证明在第一点上，可以将区块链由计算驱动的状态机，变成由验证驱动的状态机，也就是状态机从S到S1’的状态变化，不再需要全节点知道。其中的核心关系是计算，不需要知道计算细节，但是知道计算是正确的。当然这也提供了一种扩容思路，随后会再展开讲。

第二就是原本的状态机不保护隐私，比如说a给b转了一笔钱，首先要知道a和b各自有多少钱，节点才能对状态进行操作，但这在现实生活中是反直觉的（会觉得泄露隐私）。所以，如果可以让节点在不知道具体状态的情况下，执行并且验证状态变化的有效性，隐私就会得到很大程度的保护。但是到底具体是什么，可以一会再谈。

所以综合来讲，对于Crypto领域来说，零知识证明是一个非常好的工具；从计算哲学上来说，也是一种提高可扩展性的方法；从隐私保护的角度上说，它也具有一定普遍性，对于任何的数据，只需要付出一定的成本，你的隐私就可以得到比较好的保护，所以我认为零知识证明和Crypto是一个相互促进，相互成长的一个过程。

Shaun:我们聊到了隐私，聊到了扩容，正好到了您的专业领域，我们就接着谈一谈。纵观目前整个互联网的发展历程，（在区块链技术诞生之前）隐私就一直是互联网领域常讨论的话题。因为人们为了获得互联网带来各种便利，会以牺牲隐私为代价，在这其中，就会出现很多关于隐私暴露所带来的各种不便，零知识证明的出现，在细节上如何解决这种隐私相关问题呢？还有一个问题就是，我们如果再聊到区块链，一定会聊到一个话题，就是扩容（ZK-Rollup），尤其是现今结合了零知识证明的扩容技术，对于区块链的发展，它的重要性体现在哪？

姚翔：提到隐私问题的重要性，如果从负面角度，也就是一旦发生相关风险，它的危害程度是不言而喻的，所以我觉得也不必再去展开。大家在现实生活中，其实可以体会到个人数据被收集所带来的一些不便和风险。

而这件事情需要从根本上去解决，原因是什么呢？比如说，你要去酒吧，酒吧老板希望你不是一个未成年，他需要你提供证件，通过身份证上的出生年份计算你是否满18岁，同时他还要验证你提供的证件是不是本人的证件。但同时他也获得了一些额外信息，他知道了你叫什么，知道了你的住址，知道了你的身份证号，而这些信息其实他是没必要知道的（即信息泄露）。

那么如何优化这个系统呢，我们假设有一个机器，这个机器可以读取身份证（假设这个机器是可信的），把这个身份证放在上面，同时有人脸识别，你只需要站在那，然后机器会告诉酒吧老板你的条件符合要求，甚至可以更高级，扫描完符合条件就可以直接通过。这样的好处是，在可以信任这台机器的前提下，酒吧老板不会获得任何额外的信息（除非你主动告诉他），这个好处是显著的，通过采用一些算法或者新技术，可以对隐私进行更好的保护。

但在区块链上，隐私这个问题会被放大，实施起来会更困难。第一点原因是，数据是所有人都可以访问的，原本的数据只有老板知道，在老板不泄露的前提下，你的数据还是比较安全的，但在区块链上所有的数据都是可以公开访问的。第二点是，数据是永远可以访问的，如果把它当做一个持久化账本，所以那么数据公开带来的风险就更加持久。就像你不会把身份证号码传到以太坊上，即使它许诺验证后可以提供一个更低的贷款利率，你还是不会做的。所以如果不能解决隐私的问题，区块链所能支撑的应用类型，要比传统世界更加有限，和现实世界是隔绝的，如果你要把这些现实的数据放到链上，势必会向整个网络去广播，大家都会知道这个数据。

那么在采用了零知识证明技术之后，它的解决思路就在于刚描述的证明系统：我不会告诉你原来的数据，不会让你获得额外的知识（可能包含一些签名，比如身份证信息，需要有一个权威对这个数据来源的合法性进行验证）。通过构造一个算法，这个算法让区块链去验证里面的数据，是否满足某些要求，通过之后，就可以执行下一步指令，同时也不泄露任何之前的信息。

但我觉得对于大多数朋友来说，其实不用关心它到底是如何实现的，只需要知道有这个特性：数据构造出的解题过程可以让这个区块链上的智能合约或者程序，相信证明者满足某些特征，但又不告诉验证者这个数据是什么，甚至一点数据都没有泄露。这是关于隐私的一个解决方案，当然这里又有存在很多问题……

Shaun:据我所知，它可能会有一个非常中心化的节点对吗？

姚翔：对的，这个问题我觉得也需要去做辨析。首先要说的是，大多数的ZK-Rollup不是ZK的（不是零知识的），这个名字是约定俗成而来的，也就成为了一个大家的共识，但为什么不是零知识的，因为在提高扩容效率的过程中，在算法的设计上做了不少的妥协。

我们首先解释ZK-Rollup的定义，然后回到那个中心化的问题。还用以太坊为例，状态机从S到S1’的过程，是由一个Transaction（交易）驱动的。现在全节点运行的世界状态是S，然后执行一笔交易变成了S1‘，再来个交易再执行。这意味着，第一点，每个节点都要保存完整的世界状态（知道区块链上的所有的事实），才可以去做执行，因为如果把a的钱转给b，而a有多少钱不知道，是无法执行交易的，所以要保存所有的状态，这就会带来一个问题，状态的数据越来越多，同时又希望这个网络是无许可的。如果状态数据以T为计算单位（虽然现在没有那么大，一般是几百G的级别），那么个人承担机器运行的成本就很巨大，所以我们一般希望每一个以太坊节点是一个家用机器，或至少不要过于昂贵。

第二个问题是，执行过程是串行的，先执行一才能执行二，没有办法并行，因为交易的执行顺序是确定的，每笔交易之间不是完全独立的事件，所以没有办法进行并行的优化。而ZK-Rollup的思路就是，不需要再计算，我只需要提供一个证明，证明中包含的数据是：S到S1’这件事一定是对的，然后区块链其他什么也不用做，只需要把S变成S1‘就可以。

这有两个好处，一个是：全节点不需要保存所有的状态数据（这是从理想状态来说，因为证明过程附带数据是难免的）；第二个是：证明过程，也就是Proof的生成，可以用定型的方法，或者通过硬件和软件的优化来加速，而在ZK-Rollup里面，大部分通过sequence（序列）进行证明的生成，它可以把要求提的很高，原因是在这套系统里大家认为，它不会影响到系统的准入门槛，运行全节点要做的是验证状态变化的有效性（或正确性），但不需要去完整的执行整个过程。而我们也知道，验证和证明是不对称的，所以机器可能对计算的要求很高，但是验证仍可以由一个普通的节点来运行。

所以这也是很多人担忧的（或者说对这种扩容方案的一种攻击），它会带来一些其他的风险，比如节点可能会有单点故障，一个节点生成证明时掉线了怎么办，还有可能会遭受一些额外的攻击，比如它来做MEV（Miner extractable value-矿工可提取价值），或者对交易的审查，我们假设生成证明的节点，要求很高，全世界只有几台电脑可以做，但如果生产机器的人因为个人因素拒绝对某个人（或某些人）打包交易，这种情况是很难解决的。

所以从这个角度来说，这种中心化或集中化，更多是在一个是交易的审查中体现；第二个是通过交易的排序来崛取一些利益。而对一般意义上理解的安全性的影响可能并不是很大，但是它的活性可能是受到影响的，因为如果只有一个节点，但掉线了怎么办，这个是扩容角度上大家的一些担忧。

但是在隐私这个角度上，这件事可能不会成立，因为对于一个终端用户来说，一般不会把个人数据交给第三方做证明的生成。因为生成证明的过程需要原始信息，就像前面提到的，大家不会直接把身份证号码放到区块链上，但如果把身份证号码给第三方来生成证明，这里的风险仍然是存在的。所以最理想的解决方案，或许是用户在自己的电脑上或手机上，通过软件在本地生成证明，但是就现阶段来说，这件事情难度还是比较大的，但对于行业来说这是一个必须要解决的问题。

Shaun:明白了，我们聊回刚才被打断的话题，那您觉得今天在解决隐私，比如说匿名问题或者假名问题的时候，零知识证明会有哪些不足，或者解决不了的地方？

姚翔：我觉得从大的方向上来说，我们对零知识证明所能带来的Benefit（效益），都是非常期待的，但也还会有一些现实的难题，一部分可能是技术层面的，当然技术层面上，大家会觉得未来某个时间可以解决，抱一个乐观的态度。比如说证明的生成时间太长，或者是成本开销比较大，或者说针对一些特定的算法可以优化，但是针对一般化的算法可能效率就没有那么高，或者说如果在以太坊上做的话，消耗的Gas费会很高。

Shaun:这些都属于技术问题？

姚翔：对的，属于技术优化层面。虽然随着技术优化，有些事情是可以解决的，但还有一些问题，不确定性就会很大。随着这个算法的发展，它的效率也在不断的提升，但提升到什么时候，它有可能会变得平缓，这件事情是没有办法判断的。

其次从隐私保护的角度来说，它不只是一个单纯的技术问题，即使你对用户的数据进行了更好的保护，使用了再好的技术手段，最后也有可能是无用功，因为会有一个木桶效应：你建了一个非常坚固的房子，你用各种算法，设置成铜墙铁壁，但是你出门的时候，有个窗户忘记关了，那所有的防护都没有用。所以我觉得这是一个系统上的问题，大家可能意识到零知识证明或各种算法技术可以帮助大家解决隐私的一些问题，但更重要的是提高大家对这件事情的认知，知道隐私这件事情很重要，再去采用某种方法或工具进行隐私保护。只有这样才能发挥技术带给我们的好处，否则，如果你觉得只有技术就够了，然后有了一丝懈怠，那么保护效果可能不尽人意。

Shaun:我在翻阅大量的零知识证明的相关资料时，总会遇到两个跳不过的词，一个是ZK-STARKs，一个是ZK-SNARKs，所以要请教一下姚翔老师，简单来说，这两个词的区别是怎么样的呢？

姚翔：我们从它的名字上来看，ZK就是Zero Knowledge（零知识的），SNARK的S就是简洁的，N就是刚才说的非交互，ARKs是一种知识论证，连起来就是简洁的非交互知识论证，知识论证是这个证明系统的名称。我们可以这么理解，非交互体现的是刚才提到的，证明者提供了一个证明，然后验证者可以直接来检查，不需要再问额外的问题（事实上，在区块链上也没有办法构造额外提问的流程，这个事情会很复杂），所以核心词落在了简洁上，而简洁就是在说证明的长度，我们可以想象一下，考试的时候，老师让你证明a大于b或c等于d，然后你写了100页纸交上去，我觉得任何老师都不会去改这个答案，虽然你可能写的是对的，但是他没有时间来进行检查，所以我们希望这个证明的长度是比较短的，而且从可用性的角度来说，假如在区块链上，给以太坊上传一个证明，是需要支付Gas费的，所以太长显然是不可行的。所以SNARKs描述的这一类型的零知识证明。

那STARKs讲的什么呢，S是Scalable（可拓展的），T是Transparent（透明的），ARKs是知识论证。我们可以认为STARKs的证明长度更长一些，Scalable是一个描述性词汇，而它的优势体现在：Transparent。因为SNARKs需要Trusted Set Up的过程，即受信任的初始化，也就是系统最开始，需要一个秘密数（不能公开，否则系统安全性崩塌），所以SNARKs一开始，一般会有一个Ceremony（仪式），会请很多人，每人进行一个秘密的输入，通过某种算法混合起来，如果有1000人参加，那1000人里只要有1个人没参与各种形式的共谋，系统就是安全的。最近也可以看到像以太坊要做KZG Ceremony；像以前还会带上放射性元素，在直升机上利用放射性元素，来提供随机性。但在STARKs里，它认为这一套程序过于繁琐且大费周折，不需要有这种过程，整个系统会更安全。

但其实刚才你也提到，这两个词可能是绕不过的，但我认为对于大多数普通读者或使用者，没必要细究其背后的工作原理，因为可能还会看到一些词，比如Prover time或是Verifier time这些参数，只需要知道这个参数的含义就可以了，不需要去关心算法的具体细节。如果你是真的想学这个算法，那从头到尾把一个论文看完，或经过一段时间的学习也就知道是怎么回事了，但到那时可能两者之间的区别也就没那么重要了。

Shaun:那接下来我们聊个轻松一点的话题，除了Crypto领域，今天的零知识证明在其他的场景也会有应用吗？

姚翔:嗯，比如说呢？你有知道什么应用吗？

Shaun:我看到大概的，比如说云计算，线上投票，或者金融类应用。比如说像以太坊现今的发展，因为隐私各方面的问题，也使DeFi的发展受限，可能在未来它可能会跟扩容相结合去解决类似问题。所以我就在思考，比如对于现实中的金融（或线下金融），它会不会有帮助呢？

姚翔:从算法的角度（或者说理论角度），帮助一定是有的，但实现这套系统的成本也会比较高，而且这里面可能还涉及到，类似监管方面的问题。因为我曾经也在相关机构工作过，我觉得这件事情属于听上去很好，可能企业去做一个创新实验（或者说搭一个创新系统），也是可行的；但在实际业务中，是非常难实现的，所以它一般不会投入很大的精力。当然在云厂商中它会提到一些问题，所谓的秘密计算，我举个例子，你把你的数据放在云服务端，你会希望把这个数据进行加密，但加密以后又会出现一个问题：你要想查询，或者说想做一些运算的时候，就会变得比较困难。我举个简单的例子，你把公司的数据全部加密放在了阿里云上，阿里是看不到你公司员工的年龄或收入的数据的，但当你想求一下公司的相关平均数据是多少，你是没办法在云端计算的，得把数据全部又降落到本地，再进行计算，那这时云计算的意义就很有限。

所以一般会采用类似叫同态加密，或者是多方计算，将经过加密的计算结果解密就可以了，不需要在本地执行计算。但如果是做一个AI模型的训练，本地机器是支持不了的，肯定需要借助云端的运算能力。

当然这些我觉得都还在探索过程中，我觉得理论上，从工程上，这都是可以去探索的，但是企业其实不太会用这种技术手段来解决这些要求，它更多的是通过合规性方法或者是法律角度来进行系统保障。反而我认为在区块链当中，这件事情会发展更快，因为现在的银行系统都是有牌照的，这也是人们相信它的原因，但在区块链中，谁在运行开放节点或谁在开发DeFi协议这些你有可能是都不知道的，所以你使用它也是因为它的代码通过了审计，有很多人使用，系统运行了很长时间等等原因。

所以我自己认为刚刚提到的那些场景，金融或者云计算或者线上投票等等，我记得当年我们还研究过线上投票相关，就是每个人投票，然后怎么求出这个结果，但又不能暴露投票归属，还不能让一个人向别人证明他投了什么，以此防止贿选，比如说我投了a，然后我就可以拿着我投他的证据，来找他索贿。这种系统我觉得设计的都会很复杂，也想的很好，但在实际过程中实际上会简单很多，因为它是一个受监管的业务，它就不会在技术上有什么动力，因为监管说你是符合要求的，我也不会再对你提出什么额外的需求。

Shaun:明白了，因为您是密码学的科班出身，并且这些年一直专注在区块链底层技术，隐私计算技术等方面的建设，那从您的技术背景，密码学背景和区块链背景以及这么多年在前沿领域的实践，您怎么看待零知识证明，这项技术未来的发展呢？

姚翔:还是回到刚才提到的，我在上学时的那个感受，就那个时候你会发现，零知识证明你不知道有什么用，然后呢…..

Shaun:说到这个话题，我打断一下，当时老师讲课讲的是大家都觉得必须得讲，但却用不上的知识，结果发现，好像有一天离自己很近啊，这种感觉很奇妙，不得不感慨一下哈哈哈。

姚翔:是的是的，我们那个时候还学了很多，比如说盲签名，代理重加密，还有数字水印，在当时这些技术，都没有很直接的应用。但我举一个数字水印的例子，我上学的时候，数字水印最多应该就是实验用途，不会有太多商业用途，但我印象当中，有个电影叫画皮2，有一个电影院把母带打上数字水印，后面市场上流出那个版本，通过数字水印就能知道是谁泄露出来的，当时我看到那个新闻的时候，我还挺感慨的，会发现学到的东西在真实的世界产生价值。

那回到现在，密码学是一个很非常广阔的领地，比如说对称加密，非对称加密，数字签名，单项函数，它们每一个都可以分的很细。但零知识证明我觉得又比较特殊，因为它得到应用的时间，是比较短的，也就是未来仍可以有大量的新智慧投入到里面。在过去的几年里面，它的发展是很快的，我觉得这个可能有两个原因，一个是作为密码学家来说，自己的成果得到广泛应用，他肯定很开心，所以也会激励更多的人参与进来；第二个就是也要感谢，包括以太坊基金会，Zcash在内的各种Crypto项目的支持，它们会愿意为这样的研究提供经费上的支持，这些学者就不需要完全依赖学校的课题了（课题可能也提供不了那么多经费），他们通过做这些产业间的研究，一方面成果可以得到应用，另一方面生活或收入也得到了保障，我觉得这两个方面都推动了快速发展。

但至于在未来会变成什么样，我觉得很难预测，因为从非对称加密出现到如今比较普遍的应用，也就是30多年时间，RSA是1979年提出来的，这时间是不长的。同时也很难想象没有RSA或没有非对称密码学的网络世界是什么样子，它们已经遍布在现今的网络世界，例如账户系统，对网站的这种安全保护，数据的隐私保护等等方面，今天的互联网就非常依赖这些密码学的基础设施。

所以如果什么时候我们不会过多的讨论零知识证明，也就是它已经渗透到了我们的日常生活中，或者说只有一些研究的人员去讨论，它变成一个日常的，大家觉得好像是有这么回事。等那一天到来，也就说明这个技术可能达到了我们现在想要的一个阶段。

Shaun：好的，谢谢姚翔老师。Daorayaki社区一直保持着对web3领域前沿技术的持续且深入的跟踪式研究和报导，在内容选题方面，社区评审委员会所有成员一方面会继承24小时不间断的寻找行业内最新最前沿的技术发生，另一方面，也会对行业内最顶尖的前沿技术团队进行跟踪式的持续性的深入报道，这样做的目的是为了兼顾社区在内容方面的广度和宽度。

我们在研究中发现目前零知识证明在整个Web3领域，普及化的程度还很低，尤其是在中文社区，还没有一个成型的专业性的普及ZKP相关知识的社区，鉴于零知识证明这项技术可能对行业未来所产生的至关重要的作用，Daorayaki社区觉得有义务跟责任让更多的小伙伴了解熟悉甚至参与到零知识证明未来的建设中，结合Yaki叨叨，DeMedia，Podcast平台，由浅入深，多角度全方位的介绍，探讨与分析零知识证明的相关内容，而本期的Yaki叨叨作为零知识证明专题报导的第一期，只是拉开了整个篇章的序幕，更多关于零知识证明的精彩内容，敬请大家关注，感谢姚翔老师的倾情分享，让社区的小伙伴受益良多，谢谢姚翔老师。

同时也感谢Daorayaki社区，今天相关讨论的音频晚些时候会上传在 DAOrayaki官网，DAOrayaki.org的专属播客频道里。我们也会同时发布在国内的小宇宙播客平台，全球各大流媒体平台，例如苹果播客、谷歌播客、YouTube以及Spotify上，欢迎大家收听及订阅。

再次谢谢姚翔老师，我们期待下期还能跟小伙伴一起分享，我们下期不见不散。

致谢

本文的编译工作获得 DAOrayaki 的支持和资助。

邓燚：零知识，模拟与归约（一个个人化的视角）

ZKP Space

2023.10.12: 聊聊 ZKP Coprocessor

聊聊 ZKP Coprocessor

Author: Harry

Label: ZKP, ZKP Coprocessor, ZKP Space

Date: 2023-10-15

回放链接: https://twitter.com/i/spaces/1rmxPMaezNnKN?s=20

主聊人:

Harry：什么是 ZKP coprocessor？

Dong

是区块链的 coprocessor
能让智能合约有 dune analytics 的能力
现在合约面临的问题是合约不能看到： - 历史数据 - 没有 public viewable 的数据 - 其它链的数据
example：为什么要有 ZKP coprocessor
- dex 需要有 trading volume based filter 的事情
  - 没有基于交易量的一些功能
    - 比如打折等
  - 而这些功能对于 dex 很重要
    - 手续费打折可以吸引更多的流动性
    - 更多的流动性可以产生更有效的市场价格
- 为什么 dex 没有呢
  - 因为难
  - 但 cex 实际是很简单的
  - dex 两种方式做
    - 记住每个 trade action
      - 在 uniswap 试验过，每个 trading fee 都贵三倍
    - on the fly
      - 每个 trade 加 counter，做 on the fly 的功能
      - 问题：
        
        给运营的功能加到核心业务里，这是一种 overhead，增加 trader 的成本
  - 所以没有任何的 dex 做这件事
- 其实理论上，用区块链本身也能做
  - 通过将 block header 存储到一个 Merkle Tree 上面
  - 用到的时候再去查找
- 但实际上，这个方案不可行，查询一天前的一个交易就要花费 8 百万的 gas fee
只要基于用户的过去行为的逻辑，在区块链上都是不可能
这就是为什么要引入 ZKP coprocessor
计算的事情是在链下做的，不是在链上
逻辑写到一个电路里面
- 比如证明用户在 5 天交易了超过 1000 笔
public input 可以是一些 anchor point，比如某个时间段，这样可以给出这个时间段的证明，节省一些证明的时间
这样可以给出证明
为什么叫 coprocessor，这个和计算机发展有点类似，gpu handle cpu 不擅长的事情
ZKP coprocessor 就是为了解决区块链不擅长的计算，比如 data intensive 的计算: - 大量的数据 - 复杂 stateless 的计算 - 计算过程的中间值不需要存储到链上 - 只需要把最终的计算结果放到链上

0xhhh：ZKP coprocessor 和 rollup 的关系是什么？

Dong

虽然广义上都是做链下计算，然后链上有一个 anchor
但它们要解决的问题不一样
主要的区别在于 state 有多重
rollup 是有 EVM equivalent 的需求的
在 rollup 里面也是同样不适合做 data intensive 的计算
而 ZKP coprocessor 没有持久的数据存储，计算完成将结果返回给调用方就完成任务了，不需要存储下来
有些系统和 ZKP coprocessor 很像，比如 zkvm 和 zkwasm
在 coprocessor 领域，单纯的用一个 vm 是不行的，因为需要的 overhead 是非常大的
- RiskZero 已经很快了
未来的 coprocessor
- 对链上数据的计算可能需要定制化的电路和轻量级的 vm 结合的方式。
  - 定制化的电路去做什么呢？去做一些这种非常核心的，经常会要在 coprocessor 当中用到的，比如说 hash，Merkle Tree 的 inclusion，signature verification
- 然后可以把 vm 当一个 aggregation layer
- vm 上面给开发者一个友好的平台，提供一些接口，比如可以拿历史的 trade 数据做简单的加减运算
有一个需求也在 rollup 上面也部署一个 ZKP coprocessor

Cecilia：技术上补充一下 - 拿 Axiom 来说 - 只去执行 view 函数的证明 - 不去做 state transition 的证明（不做 MPT 的状态转换） - 所以这样的 ZKP coprocessor 在执行逻辑和安全假设上，可以看做为 rollup 的子集 - 而如果把 view 函数的证明放到一个广义的 VM 上面，比如 RiscZero 的 zkvm - 从执行能力（execution power）上，可以看做是 EVM 的 super set - RiscZero 是针对 general purpose 运算，不只是针对区块链

ZKP processor 的三种 proof

Dong

ZKP processor 主要做三种 proof，以及这三种的排列组合
- merkle state proof
  - 比如过去某个时间点 NFT 的 holder 是谁
  - 需要去 storage 去找这个过去的 value
- transaction proof
  - transaction 也有一个 tree，也可以做证明
  - 不管 transaction 是否成功链上都有记录
- transaction receipt proof
  - 成功后有 receipt，可以通过 event 发出来
  - 从这里可以看到交易了多少 token，这些可以用来计算 trading volume
Axiom 复用了 zkevm 中常用的电路
- 向 zkevm 借鉴了一下电路的代码，也贡献了一些代码，比如 merkle tree inclusion 的代码
- 从 zkevm 拆出来了一些电路，费了很大力气
  - 因为要做列的对齐
- 也做了很多优化
  - lookup 优化
几个做 ZKP coprocessor 的团队
- Brevis
- Axiom
- Herodotus
- Lagrange
各个团队做的方式都不一样，比如用的 framework 和 scaling solution 方式都不一样
大家在解决的技术问题
- 基于一万个 transaction 做计算
- 并以很低的成本去证明这些计算

Prover 性能优化

Dong

做性能优化，三条路
- 算法层
  - 用 halo2 怎么办
    - 可以用 lookup 优化
    - Axiom 使用了 Merkle Mountain Range (MMR)，不断的去 commit root hash
    - Brevis 使用 Mimic hash
- effective aggregation
  - 五花八门
  - 简单的多加两层 recursion，再加并行化
  - 有一些 aggregation 是可以用的
    - chain of curves：用两个 curve 导一下，试下来不比 folding 差
  - 能把一万个 transaction 压缩到分钟级别的证明
- 还可以用 folding，比较适合 coprocessor，但 folding 还差的比较远
- 差 parallelization
- 不能上链。现在接的 IPA，但需要改成 groth16，但是个大工程

使用 Folding 提升性能

0xhhh

RiscZero 说用 folding 需要的带宽比较多
用 prover 生成 proof，需要有个机器去管理 state 并分发给其它的 prover 生成 proof Dong
folding 处在三个和尚没水吃的阶段
- 大家都觉得少点东西，但工作量大，谁来加呢，因为开源后，大家都会用
- 所以 PSE 这样的比较公益的组织在做
- 但这个事情很有意义，有人组织大家一起做也是不错的 Cecilia
大家对 folding 太着迷了
在 recursion 和 folding 之间，真正在 engineer 上面我们在 focus on 的一个东西叫就是 chunk prover，这是 Taiko 和 PSE 当前的 focus
所作的事情就是如何把 execution 分成 chunk，然后就可以并行执行，并证明
最后把所有的 chunk 的执行接到一起，生成一个证明
这个其实是在目前工程中比较实际的做法，而不是用 folding Dong
- 赞同通过 continuation 来实现并行
- folding 目前短期来看投入产出比比较低 Cecilia
其实我觉得只要在学术上，在理论上有一个基本的 support 能够把 combination 本身拆开，那在工程上面拆合就有很多 engineer 可以干的事情，engineer 可以把 prover 性能优化提升 100 倍
我对 folding 的态度暂时是观望 Dong
还有一个提升性能方式是用硬件加速
- halo2 没有好的硬件加速
Ingonyama 的 icicle 挺好用的，有合作
- 思路比较简单
  - 把常用的算子放到 GPU 中
- 效果有 20 倍的提升
- Cecilia 也在实现 low level 的 gpu 加速的 api

Franci：ZKP coprocessor 和 the graph 和类似？

Dong - 大体上可以这样理解 - 但 the graph 安全性没有 ZKP coprocessor 高，因为你要信任跑节点的一方

0xhhh：ZKP coprocessor 有哪些 use case？

Dong

AMM DEX
- 问题
  - 从 LP staking 看不出来 LP 对 liquidity pool 的贡献
  - 因为只看 staking 的数量不准确
- 好的 liquidity incentive design
  - 回头看这一个月的情况去给奖励
  - 对 pool 贡献多的才给激励
游戏
- 传统的游戏除了内容之外，有两个支柱
  - 买量（获取用户）
    - 都是一锤子买卖，从广告商（youtube）买一个人，cost per install，安装一个就付钱就完了，不能再继续结合后续用户参与游戏的情况来做更多的收益分成和合作
    - 通过 coprocessor 可以改变这个单次博弈的状态
  - 运营
    - 弹窗问用户是否买 token 或者皮肤
    - 游戏体验是根据用户的历史交互决定的
- 它们是数据驱动的
- ZKP coprocessor 是可以解决这个问题的
- 可以提供给游戏用户定制化的体验
Social & Identity
- 根据用户在一个链上的 social 历史数据作为另外一个链上用户的身份证明
广泛的说，如果需要用到非同步计算，并且计算量比较大，都可以放到 coprocessor 里面做

Dong：如何让开发者基于 ZKP coprocessor 开发

让所有开发者都做电路的开发不太现实
如何解决这个问题，大家也有自己的方式
- Brevis 采用的是 specialized circuit + lightweight VM 的模式。coprocessor 的基底是很多的 specialized 的 circuit，比如 merkle tree 等
- 还有的是先做一个 use case，比如做 DEX trading volume 数据相关的 API，把这个场景涉及到的功能封装成 API 一下给开发者用。好处是开发者用着比较方便，缺点是只适用于这一个场景，其它的场景需要单独做

ZKP coprocessor 和游戏

Cecilia

因为游戏的执行对 consensus 安全性的要求是 relax 的，其实不需要像 rollup 这么频繁的提交状态，但是对 performance 的要求很高。对 performance 的这个执行环境的需求肯定是要比 ZKEVM 要 profound 很多，可能需要用 rust 代码去写，可能甚至要在 GPU 上面去跑。我觉得就是一个非常有意思的，可以 apply to ZKP coprocessor 的场景

Dong 还有些方式解决 scalability 的问题，比如用 optimistic 的方式，先相信节点的计算，如果有问题可以后面进行挑战，这种模式适用于有时间去做挑战的场景。

Cecilia 其实包括 rollup 也是这样的，你现在 Taiko 所选择的这个实现方式，我们现在叫 contestable rollup，就是随机选块去生成 ZK 证明，而不是每一个块都去 ZK 它，然后有的块用 SGX 去证明，在整个这个 space 里面就是你要去相信或者不相信一个 remote execution the result，这个完全是取决于你用什么样的机制去 secure 它，POW 还是 POS 还是 proof of ZK 这个东西完全是取决于实现。然后我觉得对于 Gaming 来说，肯定是要牺牲更多的安全性和 trust 去换他的这个optimization。

0xhhh

感觉现在整个以太坊就像一个都在朝着 coprocessor 去扩展，比如说就以太坊一直在说 PBS，实际上本质上我觉得也算是一种 coprocessor，它算是 proposal 不需要去存储整个区块链状态了，只有 builder 需要去存储整个区块链的状态，所以感觉我现在就觉得好像整个以太坊都在 coprocessor Dong
好像是最近的思潮
都是问一个问题
- 到底什么东西要放在什么地方
- 什么计算放到以太坊上比较好
- 通过功能的拆分，来做更好的状态和计算上的 scalability
我觉得可能是这个 rollup 的大的这个蓝图已经确立了之后，大家在思考如何再进一步，在已有的这个蓝图里面，怎么去从不管是从系统层面还是从架构层面更好的去优化 performance 和 scalability。我觉得可能是这个思潮驱动的。 0xhhh
我觉得确实应该说从 rollup 或者从一开始状态通道以来，其实整个区块链的发展方向，因为很慢的结算网络意味着支持比较大的计算都只能靠 coprocessor 化，所以感觉这是持续了很多年的思潮了，只不过今天可能真正给它定义成 coprocessor，大家对这个方向有一个比较明确的共识，都在推动整个以太坊的整个 layer 1 协议往 coprocessor 的方向去演变

ZKP bridge

Dong

ZKP bridge
- 本质是 bridge 一个 block header，中间的 VM 没有什么必要，只需要一个 aggregation 功能，把支持的各个链的 block header aggregate 就好了
- 开发不 scalable，需要针对每个链做一些特殊的定制方案
- 开发的过程中发现了 coprocessor 的需求 Cecilia 补充关于 ZKP bridge
假设要 bridge 一个以太坊的 block header
public input：下一个区块的 block hash
advice：当前区块的 BLS signature
aggregation：aggregate 所有的 signature
polyhedra 的 zkIBC 做出来了，是因为做了一套可以很快的 aggregate 以太坊 BLS signature 的电路。和 zkevm 没有关系
跨链验证的是共识，不是执行

Ingonyama

Dong

性能和体验还是不错的
实现了很多 curve Cecilia
用 GPU 封装算子这个事情很简单
很多从矿场出来的团队都已经积累的相关的技术
但为什么大家都选择了 Ingonyama？ Dong
因为 Ingonyama 是开源的，代码采用了 MIT 协议

参考

提到的一些zk项目和团队list：

感谢 Kurt 对部分内容的贡献

World of Z2O-K7E

📖 What is z2o-k7e?

Modern Zero Knowledge Cryptography - MIT IAP 2023

ZK Shanghai 2023 - Icer

区块链技术与应用 - 肖臻

密码学系列课程 - lynndell

Cryptography I - Dan Boneh

理解Plonk系列 - 郭宇

Halo2 - 0xPARC

高等代数 - 丘维声

抽象代数 - 张贤科