简介
Copy类操作指的是在EVM中进行不定长的一段数据数据拷贝,例如CALLDATACOPY是一种将calldata中一段数据拷贝到memory中的操作。拷贝以byte作为数据长度单位,注意和栈的U256不同。
由于其长度的不定性,即无法在编写电路时就获知数据拷贝的长度,我们难以在不引入新子电路、子表格的情况下处理此类操作。
我们的做法是,定义了copy子电路,对于Copy类操作,假设其长度为len
,在此子电路中,使用len
行来处理。每一行都要加上相应的约束来证明是从来源拷贝到去向。对于每次操作,生成的Witness就会包含len
行的copy子电路的Row。
具体的,如下操作是Copy类操作:
- CODECOPY
- CALLDATACOPY
- RETURN
- RETURNDATACOPY
- LOG
- 调用开始(开始处理一笔交易或者CALL)时,CALLDATA要被写入STATE子电路所维持的状态中。分为两种:
- CALLDATA_FROMPUBLIC: 外界(交易、公开数据)的CALLDATA输入
- CALLDATA_FROMCALL: 合约调用另一个合约的CALLDATA输入
如下图,数据的位置可能是:state子电路中的memory、calldata、returndata,bytecode子电路中的bytecode,public子电路中的calldata和log。
- CODECOPY, EXTCODECOPY:从bytecode到memory
- CALLDATACOPY:从calldata(state中的)到memory
- RETURN:从memory到returndata
- RETURNDATACOPY:从returndata到memory
- LOG:从memory到log
- 调用开始(开始处理一笔交易或者CALL)时,CALLDATA要被写入STATE子电路所维持的状态中。分为两种:
- CALLDATA_FROMPUBLIC: 从public的CALLDATA到state中的calldata
- CALLDATA_FROMCALL: 从memory到state中的calldata
设计
Witness、Column设计
共使用11列,参见代码。
更新:共使用12列,参见代码。
pub struct Row {
/// The byte value that is copied
pub byte: U256,
/// The source type, one of PublicCalldata, Memory, Bytecode, Calldata, Returndata
pub src_type: Type,
/// The source id, tx_idx for PublicCalldata, contract_addr for Bytecode, call_id for Memory, Calldata, Returndata
pub src_id: U256,
/// The source pointer, for PublicCalldata, Bytecode, Calldata, Returndata means the index, for Memory means the address
pub src_pointer: U256,
/// The source stamp, state stamp for Memory, Calldata, Returndata. None for PublicCalldata and Bytecode
pub src_stamp: Option<U256>,
/// The destination type, one of Memory, Calldata, Returndata, PublicLog
pub dst_type: Type,
/// The destination id, tx_idx for PublicLog, call_id for Memory, Calldata, Returndata
pub dst_id: U256,
/// The destination pointer, for Calldata, Returndata, PublicLog means the index, for Memory means the address
pub dst_pointer: U256,
/// The destination stamp, state stamp for Memory, Calldata, Returndata. As for PublicLog it means the log_stamp
pub dst_stamp: U256,
/// The counter for one copy operation
pub cnt: U256,
/// The length for one copy operation
pub len: U256,
/// The accumulation of bytes in one copy
pub acc: U256,
}
其中,Type是
pub enum Type {
#[default]
/// Zero value for padding, under which id, pointer, and stamp are default value
Zero,
/// Memory in state sub-circuit
Memory,
/// Calldata in state sub-circuit
Calldata,
/// Returndata in state sub-circuit
Returndata,
/// Log in public sub-circuit
PublicLog,
/// Calldata in public sub-circuit
PublicCalldata,
/// Bytecode in bytecode sub-circuit
Bytecode,
/// Null for any value in read only/write only copy, under which id, pointer, and stamp are default value.
/// If read only copy, dst type is Null. If write only copy, src type is Null. This is usually used
/// in load-32-byte opcodes such as MLOAD, MWRITE, or CALLDATALOAD.
Null,
}
例子:CODECOPY,从bytecode拷贝到memory。例子里长度为8,被拷贝的数据为0xabcd......见下表。
byte | src type | src id | src pointer | src stamp | dst type | dst id | dst pointer | dst stamp | cnt | len | acc |
---|---|---|---|---|---|---|---|---|---|---|---|
0xab | Bytecode |
contract addr | some offset | nil | Memory |
callid | some mem addr | some stamp | 0 | 8 | 0xab |
0xcd | Bytecode |
contract addr | some offset | nil | Memory |
callid | some mem addr | some stamp | 1 | 8 | 0xabcd |
... | Bytecode |
contract addr | some offset | nil | Memory |
callid | some mem addr | some stamp | 2 | 8 | ... |
Bytecode |
contract addr | some offset | nil | Memory |
callid | some mem addr | some stamp | 3 | 8 | ||
Bytecode |
contract addr | some offset | nil | Memory |
callid | some mem addr | some stamp | 4 | 8 | ||
Bytecode |
contract addr | some offset | nil | Memory |
callid | some mem addr | some stamp | 5 | 8 | ||
Bytecode |
contract addr | some offset | nil | Memory |
callid | some mem addr | some stamp | 6 | 8 | ||
Bytecode |
contract addr | some offset | nil | Memory |
callid | some mem addr | some stamp | 7 | 8 |
注意:同一次Copy的许多行里的pointer,是一样的,都和第一行相同。
门约束
- 若 len-cnt-1==0 OR len==0: next cnt=0
- 否则: next cnt=cnt+1; next src type, dst type, src xx, dst xx, len... same as cur
- 若 len==0: 说明此行是pad行,则cur的 src type, dst type, src xx, dst xx, len 全部是nil或者默认值
- 若 src type = Zero: 本行的src type id pointer stamp byte 全为0。dst同理。
- 若 src type = Null: 本行的src type id pointer stamp 全为0,byte不做约束。dst同理。
Lookup
首先,byte这一列要使用lookup进行范围证明(小于256的范围)。
然后,每一行,都要进行两个约束,向Copy的来源和Copy的去向进行查找表。查找表的来源都是此子表格的一行(的某些列),去向是“Copy的来源或Copy的去向”。我们称为Lookup1和Lookup2。
以上面为例,每一行,要进行:
- Lookup1:去向为bytecode的查找表,含义是确定拷贝的数据没错
- Lookup2:去向为state(具体tag为memory)的查找表,含义是确定拷贝的数据确实写进去了
具体的,Lookup1的情况视src type而定:
- Zero、Null:不进行lookup
- Memory、Calldata、Returndata:来源是此子表格的(tag=常数Memory/Calldata/Returndata, src id, src pointer + cnt, src stamp + cnt, byte, is_write=常数0),去向是state table的(tag, call_id, pointer_lo, stamp, value_lo, is_write),即
LookupEntry::State
- Bytecode:来源是此子表格的(src pointer + cnt, src_id, byte),去向是bytecode table的(pc, addr, bytecode),即
LookupEntry::Bytecode
(并非BytecodeFull) - PublicCalldata:来源是此子表格的(tag=常数Calldata, src id, src pointer + cnt, byte),去向是public table的(tag, tx_idx, idx, value),即
LookupEntry::Public
。注意此tag是Public的Tag。(Public代码还未完善)
Lookup2的情况视dst type而定:
- Zero、Null:不进行lookup
- Memory、Calldata、Returndata:类似Lookup1,把is_write=常数1
- PublicLog:来源是此子表格的(tag=常数tx_log, log_tag=常数bytes, dst id, src pointer + cnt, dst stamp (不加cnt), byte, len),去向是public table的(tag, log_tag, tx_idx, idx, log_id, value, len),即
LookupEntry::Public
。注意此tag是Public的Tag。(Public代码还未完善)
Core中的用法
Core子电路的执行状态中,遇到和copy相关的状态,做法如下。
CODECOPY, EXTCODECOPY
此指令遇到位数不足时,会填充0。因此,在得到 offset length dst_offset (这三个数从栈获得)后,需要判断是否需要填充,会得到两个length:normal_length, zero_length。从core进行两个copy的lookup。一个的src type是bytecode,另一个的src type是zero。这两个copy的lookup的排布,可以在cnt=2行的前9个格子和次9个格子。对于每个copy的lookup,用门约束约束其各个位置的值,然后用lookup约束从core向copy去查找表即可。
判断是否需要填充可以放到Arithmetic子电路里,通过lookup去获得normal_length, zero_length。
CALLDATACOPY
此指令遇到位数不足时,会填充0。不过,在读取CALLDATA时,我们可以让CALLDATA的默认值为0(类似MEMORY的设计)。因此,不需要像CODECOPY一样弄。此指令只需一个copy的lookup,可以在cnt=2行的前9个格子。
RETURN
此指令遇到位数不足时,会填充0。不过,在读取MEMORY时,默认值为0。因此,不需要像CODECOPY一样弄。此指令只需一个copy的lookup。
RETURNDATACOPY
此指令遇到位数不足时,会报错。因此,此指令只需一个copy的lookup。
MLOAD
此操作相当于进行了长度为32的copy,src type是memory,dst type没有,因此采用Null。注意,MLOAD往栈里写入,但是不是通过copy的形式,而是将32个byte组合成U256然后写入,因此copy子电路不处理栈的写入。acc列起到了将32个byte组合的作用。实现中,我们进行两个长度为16的copy,用acc来获得每个16-byte的U128,在cnt处使用值为16-1=15的查找表操作,用以获得最后的acc值。两个copy lookup的值记为value_hi, value_lo。于是,copy的lookup中也需要加入此acc列。在core里,通过copy的lookup获得value_hi, value_lo后,使用state的lookup写入栈。
MSTORE
此操作类似MLOAD,相当于进行了长度为32的copy,src type采用Null,dst type是memory。我们进行两个长度为16的copy,用acc来获得每个16-byte的U128,记为value_hi, value_lo。在core里,使用state的lookup读取栈,栈的value的高位和地位要约束等于copy的acc(即value_hi, value_lo)。
CALLDATALOAD
此操作与CALLDATACOPY不同,反而与MLOAD类似。相当于进行了长度为32的copy,src type是calldata,ds t type没有,因此采用Null。我们进行两个长度为16的copy,获得value_hi, value_lo,然后使用state的lookup写入栈。