微众银行区块链首席架构师张开翔:区块链上隐私掩护的挑战和应对

快讯
2020
07/01
12:19
分享
评论
发布时间:2020-07-01 00:19:10

克日,微众银行区块链首席架构师、FISCO BCOS开源区块链平台首席架构师张开翔做客HKSAIR《AI金融》系列线上讲座,以“区块链上隐私掩护的挑战和应对”为主题,探讨区块链如作甚数据隐私和信息开放构建一座天平。

以下为张开翔演讲全文,雷锋网《AI金融评论》做了不改变原意的整理:

我是微众银行的张开翔,我们团队从2015年开始研究区块链。

在讲区块链和隐私掩护之前,先简朴过一下区块链的观点和分类。

首先,真正的区块链必须是在漫衍式网络上的。区块是有序号、有高度,一个区块接一个区块地相互依赖生成,这样可以做到数据的严格校验,不丢、不错、不乱。再用密码学来校验数据的稳定性、可靠性、完整性。

下面两层加起来,更像一个漫衍式数据库或漫衍式网络。行业里有个玩笑,说它是最慢的漫衍式数据库。像比特币的TPS就是7(笔/秒),以太坊或许是10+。我们同盟链其实还是快许多,单链TPS现在是两万左右。这里就涉及到性能优化的课题了。

漫衍式这么慢,它另有什么价值?它的价值就在于多方协作。

区块链的灵魂与焦点是什么?共识。没有多方智能合约与共识算法来告竣透明、高效、可信的互助,那它就只是个漫衍式数据库。

那多方互助是为了什么?肯定是为了资产生意业务,数据分享。盘算和数据共享基于智能合约透明的规则,大家配合执行,这就是区块链。

区块链的基本特性是什么?先容隐私掩护之前,我们先来相识区块链怎么组织这些数据和规则。

首先,在每个节点里,都有相同的区块的数据结构。简朴来说,就是每个block里都包罗一批生意业务。每个生意业务可能体现的是一次资产转移,好比a给b转了100块钱。

这个生意业务必须是事务性的,生意业务执行效果在所有节点上一致,怎么做到这一点?即通过共识和数据同步,意味着所有数据都市存到链上所有节点。

如果这个链接入了10个节点,数据存了10份一模一样的;如果是1万个节点,那数据存了1万份,它也是一模一样的,一个字节不错、不丢,说明所有人都可以看到这个数据,也能验证数据。

(如果)有少量的人窜改数据,其他人可以通过共识和验证来拒绝修改,而且在发现修改之后惩戒窜改者。

所以,区块链可以告竣这样几个效果:

第一,数据难以窜改。要改,则必须算力到达50%以上,或者与链上所有或大部门共识记账节点串谋,还是可以做到窜改,但这很是难,险些不行能实现。

第二,规则透明。因为智能合约在所有列的节点上是同样的虚拟机和代码,对同样的输入运行效果肯定是一样的,是可验证的。

第三,可追溯。既然大家都有所有数据,而且数据是含括了block 0到block最近高度,这就意味着可以追溯。

因为以上几点,从而告竣了区块链最重要的特点——信任。可是,任何事情都具有两面性。

说到区块链上的隐私挑战,首先界说一下隐私是什么?你的小我私家数据和信息是隐私:除了你有几多资产、银行存款、不动产等,还包罗你跟谁生意业务,也就是银行流水。

我之前递交出国签证申请,需要附上最近半年银行流水和交税记载。其时我很惊奇,也很难接受,我以为这些生意业务关系是我的隐私数据。

从流水中的生意业务信息,可以分析出生意业务时间、所在、生意业务工具、常用的生意业务类型是零售还是转账,这些都是你的行为模式。

现在所谓的大数据营销,更多的就是基于你的身份、拥有资产、生意业务关系、生意业务频率、行为模式等信息,来对你举行用户画像,分析出你的习惯喜好。

另有一种是大容量数据文件,在商业场景较为常见。好比刷脸会留下视频,签条约会留下PDF文件,大量用户行为发生一堆大数据集,这其实都是隐私的、小我私家的、商业的数据。

所以,隐私是立体化的,它包罗许多维度,种种场景、时间、行为都市发生隐私数据。

区块链上隐私掩护的实现

那区块链上的隐私是怎么表达的呢?

以前,大家都说比特币和以太坊原来就是隐私的,但它隐私基础的重点是匿名。在比特币、以太坊上转账,用的是一个私钥和私钥生成的地址,并不包罗用户联系电话、真实姓名、邮箱等小我私家信息,大家看到的就是一串密码串。

比特币网络的建立者中本聪,到现在也没有人知道他是谁。听起来这是一个很乐成的隐私掩护方案。可是,如果你不注意私钥保管,或者自己把地址宣布到某个论坛上,让别人去给你转账,那就意味着这个地址在论坛上跟你的账号绑定了。

如果你到场了某种生意业务所,登陆生意业务所需要小我私家手机号注册、上传身份证,这时你的地址就跟身份绑定;又或者是通过反洗钱、反恐融资计谋——总之可以使用一些方法,将账户跟你的小我私家身份联系上。

从技术手段来看,IP映射是指无论你在哪台盘算机,发出哪个通信包,只要能被抓包下来,就可以分析包里的许多信息,映射到你这台电脑,获取你的账号、地址等。社工分析也可以基于你论坛上的行为、小我私家朋侪关系、动账的生意业务关系举行跟踪。如上图所示,只要转账,就有关系网,这都是公然可追踪的。

区块链的特征是透明、共享、可追溯、广泛到场:

透明就意味着拓展了信息袒露的维度;

共享就意味着增加了数据存储的位置,所有节点都存储数据;

可追溯就意味着你的隐私数据存储可能是永久的,并不是存储一段时间后就删掉抛弃,延长了隐私存储时间,就很难被遗忘;

广泛到场,是说区块链作为漫衍式网络,一定是有各方共识的,这时,到场的网络里就可能有短板,而公然的网络情况更容易掺入非信任角色,同盟链在这一点上相对会好些。

所以,区块链其实带来了更大的隐私挑战。有种说法是区块链大量使用了密码学,所以它是可信可验证的,但其实这里的因果关系要更换一下——是因为区块链自己追求公然透明,为了在公然透明的基础上告竣信任和验证,才要引入更多密码学算法。

在事情中,我们会遇到许多灵魂拷问:

作为一个金融机构,天天的生意业务信息都是透明的吗?

怎么做到上链的数据可验证,但又不被看到,更不会被窃取?

数据上链后,能不能删掉?

加密数据会不会被暴力破解?

现在都用椭圆曲线、RSA算法、对称非对称加密,用很长的密钥来掩护数据。从数学理论上来说这些都可确保数据宁静,但量子盘算出来之后该怎么办?

……

小我私家认为,量子盘算技术成熟到应用可能还没这么快,现在来看,量子盘算的形态可以交流密钥,但想要处置惩罚和破解大量数据还是比力难。

可是,对金融业来说,如果数据保留二、三十年,甚至永久保留,纵然使用长密钥加密,链上数据也可能被破解。父亲的数据被破解,影响了儿子,影响几代人,(这种现象)理论上是存在的。

固然,密码学掩护和攻击的两个阵营,是呈交织螺旋上升式:你有矛,我就有盾,只是看矛和盾哪个硬,要用几多成本去掩护数据。

隐私掩护在实际场景中的应用

金融典型场景一:风控

假设一个借贷服务,涉及多机构配合到场,这些机构团结为借贷人提供资质证明和资金,这就意味着这些机构要投票判断用户信用、决议贷款利率等。

但金融有风控独立的要求,就是a机构与b机构的规则应该是相互独立、各自运作的,如果只有一套规则且全部透明就有可能被人猜到。

这还涉及到用户隐私问题,好比用户在a机构发生的生意业务数据,不应该直接交给b机构,a机构和b机构都应该用自己的数据和数据来对用户举行判断。这些都是隐私掩护。

征信和风控有相似之处,但其中的差别是征信要用大量的、多维度的有效数据,涉及到社保、银行、税务各机构的多方到场。怎么把差别维度、差别机构的数据毗连在一起,整理出风控模型,这就自然而然遐想到联邦学习。

金融典型场景二:资产流转

下图左侧展示的场景类似二级市场:有刊行、署理销售,署理机构a不希望署理机构b知道自己的署理情况,用户不希望别人知道自己买入卖出,这都是小我私家账务资产变化,属于隐私信息。

隐私掩护计谋,哪个更好?

现在确实有许多隐私掩护的计谋,像是零知识证明、宁静多方盘算、可信硬件情况、全同态密文盘算等,另有相关规范尺度,那是不是就能完整掩护隐私了?我的看法是,每种隐私掩护计谋各有所长,各有所短,它的是非可能都体现在性能、功效、庞大度和中心化水平上。

零知识证明和宁静多方盘算,就是隐私掩护的核武器,很是有潜力。

但其也有局限,好比零知识证明重点在于证明一个事物的有效性,而不在于运算,但用户的账目、风控模型都涉及盘算。

宁静多方盘算是可以用于团结盘算,但现在它处在从两偏向多方生长的阶段,多方宁静解决起来比力难题,牵涉成本、盘算量、庞大度。

我们都知道,手机有个宁静区,把密钥掩护在宁静区可以降低宁静风险——但一个大企业把成千上万的数据掩护在宁静区,就相当于完全依赖宁静区。宁静软硬件依旧会有毛病,还是要实时升级,总的来看,依赖硬件体系的反映速度会比力慢。

同态很是有趣,两个密文相加获得一个密文,密文解密之后是这两个密文对应的明文相加的效果。它可以用于多种情况的账目盘算,但只能盘算,很难验证,也就是盘算效果如果是错的,在密文情况下无法得知。

而且,现在同态一般是用于加法盘算,乘法盘算的速度比力慢。另外,同态的数据量如果是比力大,那么其数据膨胀和运算速度降低就会很是显着。

群/环签名,它很轻也有不错的性能,但主要面向身份,不面向数据。

规范和尺度,依赖许多链外治理手段,好比处罚、司法追责。我们要把这些手段全部综合起来,在性能、功效、庞大度和中心化中取平衡,在差别的场景下扬长去短,来到达成本和效果的最优。那就要求从多维度思量隐私掩护,它是个立体的场景化问题。

身份、资产、生意业务,这是我们要掩护的基本信息。

首先,这些信息是否可见?如果连数据都碰不到,那没措施使用这些数据做任何事情。

其次,能看到之后,我们能不能使用?如果看到的是一串密文,那无法使用,还可以运用混淆、脱敏的方式来保证这些信息不完整性。例如,有账户信息,但没有身份信息,这样就无法被使用。

好比,密码学有个密码信封,只有信封密钥的人才气打开。又或者是使用许多方式,好比一次一密的假名,来防止关联,这样就无法对用户举行画像,外人可以看到的只是伶仃的数据,没有措施对用户做什么。

最后,就是你看到的数据能不能被控制。控制数据就是说,你们把我的账转给别人,改变我的属性,我就要做权限控制,做宁静加密的宁静计谋和多方制衡。

正如前文所述,区块链有个特点:如果你改数据,别人差别意,共识算法不通过,我有拜占庭容错,这就是一种多方制衡。

我们要到达几个效果:看不见数据,不知道数据,不能改,但它在区块链上依旧是可验证、可羁系。

这就是同盟链的特点——要可羁系、正当合规,这些要求要笼罩链上整个生命周期,包罗收集、传输、存储、使用、屏蔽、销毁。

生命周期的每个阶段都有差别的特点,情况还牵涉网络、存储、内存盘算和云,要用差别的技术手段去应对。所以我们的整个国界还是很庞杂,图上的底层就是种种各样的隐私技术,并不是一两个算法、密码答应或者简朴的不经意传输就能够涵盖的。

从可见、可用、可控思维看区块链

同盟链治理

同盟链跟公有链最大的区别在于,同盟链有准入机制。所有接入同盟链的人、机构、节点、身份都是可知的,接入前需向运营委员会申请。

委员会是多中心化的,并非单点。如果大家同意你加入这个链,给你分配了证书、公私钥,就可以接入这个链。方式是提倡毗连。如果这小我私家或节点在链上有恶意行为,委员会还可以把他踢掉。

隔离

机构到场业务时,有可能和差别的人发生生意业务,作为机构,会希望这些人里没有交集,这样同业的倾轧、数据泄露等情况都不会发生。

我们研发的底层平台有一个群组架构,就是在区块链上拉出一个局部共识的独立账本。群组里信息相互隔离,群可以扩容,也就是你可以建设无数个群,笼罩无数业务,这样从性能、功效上来说都有极大利益。在差别的群、差别的链上的差别信息需要相互验证、买通,就走跨链的路径,这项技术宁静上是可控的。

角色隔离,首先要界说清楚,差别的人做差别的事情。有个术语叫DO分散,就是开发和运营分散,开发不能做运营的事情,运营也不用去写代码。

扩展一下,就是建设、治理和使用是分散的,制止一个角色又当裁判又当运发动,以免他触达太多数据,可能会侵害隐私,这就是整个同盟链的角色分层理念。

适才说到了节点、人、权限的隔离,再看数据隔离。我经常被问到一个问题:要传输一个文件,能不能上链共享,但同时上链后不让所有人都看到这个文件?这时,可以将文件加密再放上链。

另有一种文件不需要上链的方法,链上存储的是一些标识或URL,是一些哈希,它们相当于文件的指纹。通过链上链下联合:链上建设哈希指纹,链下传输文件,用户可以在链上获得指纹,去验证文件。

如果文件密级不高,可以用IFPS,但它是把文件分片,依旧可以串谋几个盘算机把文件分片聚集再拼出文件。如果是密级较高,还是建议用自有存储的方式。

生意业务隔离,链下有些私有生意业务,是高频、小额、点对点的,可以放到链下,像闪电网络就是类似气势派头。这样操作一方面可以提高性能和响应速度,更重要的是解决生意业务关系的问题。区块链上的两小我私家通过点对点网络相同,完全可以不经由服务器。所以点对点的历程是完全隐私的,只是最终发生了账目,总账里不包罗这种点对点生意业务的隐私信息。

漫衍式标识协议(DID协议)

这个协议是由DIF(全球漫衍式身份基金会)与W3C(万维网同盟)国际尺度化组织配合推进,目的是形成开放网络,大家统一身份、互联互通,做到数据无缝共享和流转。这种模型可以毗连人、物联网、数据,服务种种各样场景,包罗金融、政务、医疗。

它是很是开放且通用的尺度,到场其中的用户可以自行控制并拥有数据,这跟之前许多互联网模型不太一样。在互联网模型里,互联网巨头生存所有数据,我们说的在“云”上,(其实)都在别人机房里。用户只有一个登陆密码,没有治理和拥有数据的权限。

这是很是重要的一点:用户生存、控制自己的数据,这个数据是一种凭据,从权威机构,或是用户业务行为而来,它们不仅仅是数据,而是证明,是可信、可验证的证明。

怎么明白漫衍式DID协议?

首先,用户要做KYC,好比刷脸,叫KYC生成标识。全局唯一标识,标识的样子就是密码串。中间这条竖线左边所有工具都是用户自己持有和控制的,右边是你要交出去的,中间就起到防火墙作用。

这里有个隔离,谁找你要什么数据,必须讲明会见计谋,就像你的安卓手机安装APP时,询问你开启摄像头权限,也就是用户同意会见计谋,才会给出一个表述或披露。这个披露可验证,但它是选择性的最小化披露。

这就是隐私掩护很是重要的模式:你生存治理自己的数据,昭示同意,经由批准、审核之后,挑选一些数据,把它生成一个密文证明,给到对方去认证。因为区块链毗连了权威机构、用户、商家,所以在链上举行可信的验证,就是区块链和隐私掩护的一个有机联合。

企业数据则涉及人、行为、业务的大量数据,如果要团结做业务,就会思量接纳联邦学习,在多家机构做到数据不出自己机构,还能够训练出一个有效模型。

这个模型就可以导入区块链上,链上的行为,风控、生意业务汇率、信用评级、订价等等,都可以接纳联邦学习训练出的模型,很是有意义。

差别目的要接纳差别的算法,好比收集大量的数据,要做差分隐私;为了防止画像而做假名化;数据脱敏再做同态加密,汇总到云上,这都是大批量的群体数据算法,适用于大数据挖掘以及联邦学习等。

再来看看身份隐秘,其适用在匿名支付、匿名投票、匿名竞拍场景。如果可以匿名,又可羁系的话,用户就不用担忧自己的投票行为会招致别人非议。

数据隐秘,资产里的数字、生意业务行为,都是数据。支付、投票、竞拍,这都是场景。其中可能用到包罗同态加密,零知识证明、宁静多方盘算、TEE等技术。这一系列的技术怎么为业务所用?

前面提到这么多隐私掩护计谋、数据维度和算法,一个场景不太会每个技术都用到,所以我们把这套技术整合成开发包方案,笼罩从业务层、服务层、区块链到智能合约的整体架构,差别的客户端用差别的密钥,使用SDK和模板工具生成场景所需的隐私掩护工程和计谋。

值得一提的是,每小我私家的隐私偏好有所差别,但我们是以最严厉的隐私掩护尺度来做的,这样对整个生态的未来才是康健的。我们的技术也是开放的,包罗区块链,绝大部门都是开源易用的,可以适配许多场景。

总结一下:隐私掩护,时机和挑战并存。隐私掩护是立体化计谋,去设计一个通用的隐私掩护计谋其实很难,我们现在做的是针对大量场景做有效实现,也接待大家一起研究实践,一起告竣技术、业务以及整个生态价值的突破。

即将启幕

CCF-GAIR 全球人工智能与机械人峰会———AI金融专场

历届 CCF-GAIR 已汇聚多位诺奖、图灵奖得主,28位海内外院士,21位世界A类顶会主席,103位Fellow,400多位知名企业家以及100余位VC首创人出席。

8月7日-9日,《AI金融评论》将在第五届CCF-GAIR中举行「AI金融专场」,现在统计学“诺贝尔”— COPSS总统奖得主,摩根大通执行董事,世界顶级学会主席,金融巨头首席科学家、首席风控官,已确认出席。

雷锋网雷锋网雷锋网

THE END
广告、内容合作请点击这里 寻求合作
数据 区块 隐私 掩护
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表果壳财经的观点和立场。

相关热点

中新经纬客户端1月2日电 克日,海内知名市场调研机构艾瑞咨询公布《太古宙 - 2019年中国区块链金融行业研究陈诉》(以下简称“陈诉”),陈诉认为相比其他技术,区块链与金融业升级需求存在更强的匹配性,在金融业科技化升级中饰演着重要角色。陈诉对区块链技术在供应链金融、资产治理、支付及金融风控等领域的应用举行了全景式展现,并联合京东数科、微众银行、蚂蚁金服等代表企业在区块链金融应用层面的案例举行了深度
快讯
《关于增强残疾儿童少年义务教育阶段随班就读事情的指导意见》印发 推动残疾学生随班就读,大数据和区块链被“点名”了 克日,教育部印发《关于增强残疾儿童少年义务教育阶段随班就读事情的指导意见》(以下简称《指导意见》),对新时代进一步增强随班就读事情,完善随班就读事情机制,提升随班就读事情水平作出部署。 随班就读,简朴明白,就是让残疾学生进入普通班就读。增强随班就读是中央的明确要求,对实现特殊教育公
快讯
凭据《2019年中国VC/PE项目退出收益研究陈诉》显示,2019年上半年我国股权投资市场资本治理量凌驾10万亿,已成为全球第二大股权投资市场。股权投资规模暴增之下,股权的持有、挂号、行权、退出等问题是股权持有者最大的痛点。区块链技术不行窜改,可追溯,全透明的特性,能游刃有余地解决这些难题。区块链可以在以下几个方面为股票生意业务市场提供全新的方案。 1)流动性 一般来说,市场流通性低会令持有者
快讯
泉源 | 苏宁财富资讯 2019进入尾声。有人用“一半海水一半火焰”来形容即将已往的一年,也有人说2019年的金融科技履历了高光与落寞。 央行金融科技生长计划的公布、大数据风控行业的整治、银行系金融科技子公司的强势崛起、数字钱币雏形初见、金融羁系科技的蓬勃生长和羁系沙盒的落地、风控技术追随行业的变化而发生的深刻变化、3D感应技术的兴起等等,这一切都在为我们徐徐展开了一幅金融科技未来生长的雄伟画卷。
快讯
BTC技术面分析: 日线来看 大饼在下方7000关口震荡之后 大饼就开始一路上涨 年后直接上涨3000点 现在从日线来看 大趋势还是一个多头趋势 日内重点关注如果高点不破 谨防深度回调。 如果下方10000支撑破位举行深度回调的话 可能大饼回调9000四周。做多得朋侪重点关注10000关口 10000破位 实时止损离场。寻找底部做多。 4小时来看 现在大饼多头趋势减缓 上方冲高10200四周开始回
快讯

相关推荐

1
3