本站提供福彩开奖结果,预测,图谜,胆码,杀码,开机号、试机号、开奖结果、杀号定胆等专业彩票信息网站

首页 >  彩票资讯 / 正文

「3D校验码是什么意思」3d2016149期校验码是多少

admin 2020-02-18 彩票资讯
3D校验码是什么意思:3d2016149是校验码的数目 Shouquebaocanshǒu阙宝能 成语解释 亦作“抱守阙的残留物。”保留的东西保持完整。保守的比喻学习它,不思变。 成语。 陈独秀“我最后的意识”:“其次是政治,经过多年的政府证明,一直无法跟上持有剩余缺乏潜力。” 3D校验码是什么意思:3D验证码怎么老出错 如果您目前在官方QQ空间QQ进行滤波处理,有可能你发表同一主题或操作频率过快检测系统到极限,然后它会一直错误代码会出现这种方法必须等待一点点长:查看密码的安全级别,如果不是最高的,然后去到最高吧,顺便改密码!如果已经在的情况下最高的,它会更改密码,同情2的方法:从qzone.qq不直接从QQ进入空间,但(以域名复制到地址栏,回车就可以了) .COM输入,QQ空间登录,然后进入三:其他高级别人的空间,然后在窗口或左上角的左下角(看你用什么浏览器)有一个“我的空间”进入试试! ! !请确认处于良好状态你的网络后,试图解决以下步骤:一定要清除IE垃圾!这可以帮助您解决在访问哦很多问题!清除方法:方法4:请点击IE浏览器中的“工具”,选择“internet选项”;在“常规”页面点击“删除文件”,然后勾选“删除脱机内容”,点击确定;请您点击IE浏览器中的“工具”,选择“internet选项”,进入“安全”页面,点击“自定义级别”,“可安全执行脚本的ActiveX控件标记脚本”设置为“启用”;您可以尝试暂时关闭以及其他相关上网助手,然后进入QQ空间的访问,如果可以访问,请检查您的上网助手设置;确保您的防火墙没有阻止Qzone.exe接入网络;如果不解决,你也可以做到以下几点:(1)打开IE浏览器,选择“工具”菜单 - “Internet选项” - “高级”选项卡 - 点击“还原为默认值”,关闭所有IE浏览器窗口,然后点击“好”; (2)打开IE浏览器,选择“工具”菜单 - “Internet选项” - “常规”选项卡--Internet临时文件设置“检查时所存网页的较新版本检查‘选择’每次访问此页。”并点击在Internet临时文件“删除文件”,之后的“删除所有脱机内容”设置预打勾单击确定关闭对话框,关闭所有IE窗口; (3)打开IE浏览器,选择“工具”菜单 - - “Internet选项” - “安全”选项卡,在选择“Internet”,“请制定的安全设置(z)是一个Web内容区域”窗口,然后选择“自定义级别”和“ActiveX控件和插件”中的“下载已签名的ActiveX控件”,“运行ActiveX控件”和“启用”或“提示”,点击确定,重新启动计算机; (4)如果你已经安装了3721上网助手之类的软件,请完全卸载它。 收养的麻烦,谢谢! 3D校验码是什么意思:为什么登陆3D验证码错误,指出它 3D灯光秀的方法:方法一:3DQQ显示:登录到3D的网站点击,但这个过程是缓慢,有时点亮,如果不能完成着陆灯是有两天试下(免费,可亮)方法二:“3D显示用户”图像上方的图标1.点击进入网站,在左侧框和密码填写用户名; 2.点击“3D动作展示厅”的顶部导航,可以看到自由移动,买了一个动作,直接支付,因为它是0.0Q币,马上就能看到QQ上的3D地图想帮助你,祝你快乐,谢谢采纳。 ... 寻求通过 3D校验码是什么意思:三维2016年085校验码 每个人都有自己的长处和短处 [发音]:chǐ你suǒduǎn,存你suǒchánɡ [解释]:短:不足长:不止。比喻有优点,也有缺点,有优点给对方。 [从]:CHU屈原“卜居”:“夫尺有所短,寸有所长,是不充分的智慧有数量不明的有点不称职的,上帝是不合理的。” [例]:像姚明,“李自成”第二卷第八章:但古人云:“?”我们只是忠实助手李自成,有随时提供。 3D校验码是什么意思:什么是信用卡验证Asiabill3D 3D隧道验证? 3D是一个经过验证的信用卡组织客户安全性是通过网上购物提供的免费服务。当持卡人在网上购物,你必须输入账号预设个人密码,以避免未经授权的使用信用卡,就如同密码中使用自动取款机时。此外,当注册持卡人验证是必要设置个人资料。在这之后,每次在线支付,持卡人可以验证这一点的个人身份信息,以确保您使用的是正确的3D验证服务。持卡人可直接通过电话给他发卡银行新增此服务,或访问发行人组的官方网站。签证叫做VISA验证(VBV),万事达卡,万事达卡称为安全代码(MSC)。事实上,这是口令卡客户在网上购物环境验证,以确保该卡是我的客户使用该卡的问题。 信用卡使用称为3D频道3D频道,即客户需要在3D的消费者网站进行验证的验证,可能是在银行设置您的手机验证码或其他识别信息之外,如果验证失败,支付失败。 Asiabill国际信用卡收单,对3D验证的支持。 3D校验码是什么意思:2014 320 3D校验码? 枣泡酒可以听到,人们习惯用于治疗酒精枣沫剂直接或风湿麻木,跌打损伤等症。在中国医药,种子,木材药,具有清热,利尿,解酒毒的作用。 在他们的解酒毒古籍,也有许多轶事记录。陆机“舒逸”,他说:“南人......昔有使用这种木材来修理房屋,错误地陷入了酒瓮,酒入水也” 3D校验码是什么意思:福彩双色球认证码,如:63E3-02AA-3D75-0B97-8524有任何密码或密码的东西,对不对? 这是每个彩票有一个代码,而且每一个都是不同的,非常复杂的,而且这些数字加字母组合的方式的安全性有上百万的可能性,这相当于该彩票的身份,也获奖证书彩票中奖机进行扫描或人工输入授予这组数字后,也没有赢得如果输入扫描彩票,差异将是准确的。 3D校验码是什么意思:什么是3D验证的国际信用卡? 1,3D验证服务是在线支付的安全性,提高信用卡网上支付,持卡人的在线保护的安全,持卡人保障推出的支付安全验证服务的所有中国信用卡有万事达卡标志的利益。服务,谁接受万事达信用卡的网上商户可以交易的开放后。 通过密码验证2,3D交易验证服务,提供针对网络欺诈交易的风险完全保护;复试由个性化的信息,以确保持卡人正宗的购物网站,只要加入此服务的网上商店购物,他们可以得到全方位的安全支付安全,安心的享受购物的乐趣。 3D校验码是什么意思:3D购买门票需要输入验证码,总是说输入错误,怎么3D输入验证码 如果您在使用Visa或MasterCard支付渠道票,网站将导致Visa的验证通过Visa或Master安全网页认证,可直接进入发行人的验证页面的万事达卡。

3D校验码是什么意思:人脸识别系统中的活体检测技术有哪些分类

人脸识别系统在实际应用中会面对照片、视频、面具等道具攻击,为了这防止这些欺诈手段,在系统中应用到活体检测,检测识别的人员是否为活体,提高应用的安全性。由畅视智能与你分享应用到人脸识别系统中的活体检测技术有哪些分类?

在线图片活体检测

通过人脸识别系统中的活体检测来实现活体判断,原理是基于图片中人脸图像的破绽判断目标对象是否为活体,有效防止屏幕二次翻拍等作弊攻击。

动作配合式活体检测

这个方式通常集成在人脸采集SDK里,例如用户在使用支付宝、滴滴这些APP进行人脸识别检测时,就会有这种检测。其实现活体判断的方式是,通过给出用户指定动作要求,用户需配合完成,通过实时检测用户眼睛,嘴巴,头部姿态的状态判断是否为活体。

视频活体检测

在系统检测时,用户通过上传一个现场录制的视频,录制时读出随机分配的语音校验码。运用活动检测技术分析这个视频的人脸信息以及语音校验码是否匹配,完成活体检测判断。

集成在人脸离线识别SDK中的活体检测

包含有离线RGB活体检测、离线近红外活体检测、离线3D结构光活体检测,这些名字可以看出这种活体检测对硬件设备要求较高。例如iPhone X的前置摄像头可以通过投射出点阵红外光,采集用户面部的深度信息,进行检测。

随着对人脸识别技术的发展,在未来会有更多种方式来防止道具的攻击,提高人脸识别的安全性。

3D校验码是什么意思:为什么很多网站知道我填写的身份证号不对?

身份证号的组成结构:

区域码(6位) 出生日期码(8位) 顺序码(2位) 性别码(1位) 校验码(1位)

共18位。

  • 区域码 指的是公民常住户口所在县(市、镇、区)的行政划区代码,如110102是北京市-西城区。但港澳台地区居民的身份号码只精确到省级。
  • 出生日期码 表示公民出生的公历年(4位)、月(2位)、日(2位)。
  • 顺序码 表示在同一区域码所标识的区域范围内,对同年、同月、同日出生的人编定的顺序号。
  • 性别码 奇数表示男性,偶数表示女性。
  • 最后一位是校验码。

前面的没啥好说的,最主要的是最后这个校验码

最后一位是校验码,这里采用的是ISO 7064:1983,MOD 11-2校验码系统。校验码为一位数,但如果最后采用校验码系统计算的校验码是“10”,碍于身份证号码为18位的规定,则以“X”代替校验码“10”。

可能这个解释你不能看懂,那么我下面手撸一遍计算过程。

校验码计算方式(小学生能看懂版本):

假设一个身份证前17位:33078119850907809

  • 取身份证第1位
  1. 计算17减0[身份证位数减1] 17-(1-1)=17
  2. 计算2的17次方 2^17=131072
  3. 计算131072除以11,取余数 131072?11=11915……7 下面以 131072%11=7 表示
  4. 用7乘以3[身份证号第1位数字] 7*3=21
  5. 记录下21这个数字

取身份证第2位

  1. 计算17减1[身份证位数减1] 17-(2-1)=16
  2. 计算2的16次方 2^16=65536
  3. 计算65536除以11,取余数 65536%11=9
  4. 用9乘以3[身份证号第2位数字] 9*3=27
  5. 记录下27这个数字

取身份证第3位

………………

取身份证第17位

  1. 计算17减16[身份证位数减1] 17-(17-1)=1
  2. 计算2的1次方 2^1=2
  3. 计算2除以11,取余数 2%11=2
  4. 用2乘以9[身份证号第17位数字] 2*9=18
  5. 记录下18这个数字
  • 我们把这17个数字相加最后结果是423(不信可以自己手动算)
  • 计算最后结果423除以11 取余数 423%11=5
  • 计算12减5 12-5=7
  • 计算7除以11取余数 7%11=7

最后的计算结果只可能是0-10 这11个数字(感谢@乔松 的指正),因为身份证号只有18位 所以如果最后这个校验码是10那么就记为X

那么我们得到最后一位的校验码是7

如果你有时间,可以手动计算一遍自己的身份证校验码。

为了避免重复计算已经帮你把前面17步重复计算的前三步结果计算好了。

7,9,10,5,8,4,2,1,6,3,7,9,10,5,8,4,2 校验码权重:1

也就是你每位身份证号乘以对应位数的数字就行。

后面的计算 拿计算器的话 大概一分钟之内能算完。

如果算对了的话 记得回来点赞

下面给出校验码计算的代码 --python3

 def get_check_digit(idnumber):n        """通过身份证号获取校验码"""n        check_sum = 0n        for i in range(0, 17):n            check_sum += ((1 << (17 - i)) % 11) * int(idnumber[i])n        check_digit = (12 - (check_sum % 11)) % 11n        return check_digit if check_digit < 10 else 'X'


下面给出自动生成身份证号的代码 --python3

输出结果


#原项目地址:https://github.com/jayknoxqu/id-number-utiln#我稍微做了一下修改nnimport randomnimport renfrom datetime import datetime, timedeltann# 十五位身份证号表达式nID_NUMBER_15_REGEX = r"^[1-9]d{5}d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)d{2}$"nn# 十八位身份证号表达式 identity_utilnID_NUMBER_18_REGEX = r"^[1-9]d{5}(18|19|([23]d))d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)d{3}[0-9Xx]$"nn# 区域信息nAREA_INFO = {n    #这块信息比较多,我附上链接 你们自己去复制过来n    #https://raw.githubusercontent.com/jayknoxqu/id-number-util/master/constant.pyn}nnnclass IdNumber(str):nn    def __init__(self, id_number):n        super(IdNumber, self).__init__()n        self.id = id_numbern        self.area_id = int(self.id[0:6])n        self.birth_year = int(self.id[6:10])n        self.birth_month = int(self.id[10:12])n        self.birth_day = int(self.id[12:14])nn    def get_area_name(self):n        """根据区域编号取出区域名称"""n        return AREA_INFO[self.area_id]nn    def get_birthday(self):n        """通过身份证号获取出生日期"""n        return "{0}-{1}-{2}".format(self.birth_year, self.birth_month, self.birth_day)nn    def get_age(self):n        """通过身份证号获取年龄"""n        now = (datetime.now() + timedelta(days=1))n        year, month, day = now.year, now.month, now.daynn        if year == self.birth_year:n            return 0n        else:n            if self.birth_month > month or (self.birth_month == month and self.birth_day > day):n                return year - self.birth_year - 1n            else:n                return year - self.birth_yearnn    def get_sex(self):n        """通过身份证号获取性别, 女生:0,男生:1"""n        sex_num = int(self.id[16:17]) % 2n        if sex_num==0:n            return "女"n        else:n            return "男"nn    def get_check_digit(self):n        """通过身份证号获取校验码"""n        check_sum = 0n        for i in range(0, 17):n            check_sum += ((1 << (17 - i)) % 11) * int(self.id[i])n        check_digit = (12 - (check_sum % 11)) % 11n        return check_digit if check_digit < 10 else 'X'nn    @classmethodn    def verify_id(cls, id_number):n        """校验身份证是否正确"""n        if re.match(ID_NUMBER_18_REGEX, id_number):n            check_digit = cls(id_number).get_check_digit()n            return str(check_digit) == id_number[-1]n        else:n            return bool(re.match(ID_NUMBER_15_REGEX, id_number))nn    @classmethodn    def generate_id(cls, sex=0):n        """随机生成身份证号,sex = 0表示女性,sex = 1表示男性"""nn        # 随机生成一个区域码(6位数)n        id_number = str(random.choice(list(AREA_INFO.keys())))n        # 限定出生日期范围(8位数)n        start, end = datetime.strptime("1960-01-01", "%Y-%m-%d"), datetime.strptime("2000-12-30", "%Y-%m-%d")n        birth_days = datetime.strftime(start + timedelta(random.randint(0, (end - start).days + 1)), "%Y%m%d")n        id_number += str(birth_days)n        # 顺序码(2位数)n        id_number += str(random.randint(10, 99))n        # 性别码(1位数)n        id_number += str(random.randrange(sex, 10, step=2))n        # 校验码(1位数)n        return id_number + str(cls(id_number).get_check_digit())nnif __name__ == '__main__':n    random_sex = random.randint(0, 1)  # 随机生成男(1)或女(0)n    id_number=IdNumber.generate_id(random_sex)# 随机生成身份证号n    print(id_number)n    print(u"地址代码:",IdNumber(id_number).area_id)  # 地址编码:410326n    print(u"地址:",IdNumber(id_number).get_area_name())  # 地址:河南省洛阳市汝阳县n    print(u"生日:",IdNumber(id_number).get_birthday())  # 生日:1995-7-10n    print(u"年龄:",IdNumber(id_number).get_age())  # 年龄:23(岁)n    print(u"性别:",IdNumber(id_number).get_sex())  # 性别:1(男)n    print(u"校验码:",IdNumber(id_number).get_check_digit())  # 校验码:7n    print(u"有效性:",IdNumber.verify_id(id_number))  # 检验身份证是否正确:False

看到评论区有小伙伴讨论如何知道 身份证号和名字不匹配。

我发现了一个比较详细的回答,不是我写的,先点赞再过去啊。

公安系统身份证查询接口如何申请?

3D校验码是什么意思:3D ResNet(Spatiotemporal 3D CNNs )

文章:《Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?》(时空三维CNN能追溯二维CNN和ImageNet的历史吗?)

链接:arxiv.org/pdf/1711.0957

代码:github.com/kenshohara/3

【摘要】本研究的目的是确定当前的视频数据集是否具有足够的数据来训练具有时空三维(3D)内核的深度卷积神经网络(CNNs)(也就是3D卷积神经网络)。近年来,3D CNNs在动作识别领域的性能水平有了显著提高。然而,到目前为止,传统的研究只探索了相对较浅的3D架构。我们研究了当前视频数据集中从较浅到很深的各种3D CNN的体系结构。根据这些实验的结果,可以得出以下结论:(i) ResNet-18在UCF-101、hmb -51和ActivityNet训练会导致过拟合,但Kinetics上不会。(ii)Kinetics数据集有足够的数据用于深度3D CNNs的训练,并支持多达152个ResNets层的训练,有趣的是,与ImageNet上的2D ResNets类似。ResNeXt-101的Kinetics测试集平均准确率达到78.4%。(三)Kinetics预训练简单三维结构优于复杂二维结构,预训练resnext-101在UCF-101和HMDB-51上分别达到94.5%和70.2%。

在ImageNet上使用二维CNN已经在图像的各种任务中产生了显著的进步。我们相信,将深三维CNN与Kinetics结合起来,将追溯二维CNN和ImageNet的成功历史,并刺激视频计算机视觉的发展。

【介绍】深度卷积神经网络(CNNs)具有大量的参数,使用大规模的数据集是非常重要的,近年来,CNNs在计算机视觉领域的应用有了显著的扩展。ImageNet[4]包含了100多万幅图像,为基于视觉的算法的成功创建做出了巨大贡献。除了这样的大规模数据集,还有大量的算法,例如残差学习[10]已被用于通过增加CNN的深度来改善图像分类性能,并且使用在ImageNet上训练的非常深的CNN促进了通用特征表示的获取。反过来,使用这种特征表示显著提高了其他几个任务的性能,包括对象检测、语义分割和图像描述(请参见图1的顶行)。

迄今为止,与图像识别数据集相比,可用于动作识别的视频数据集相对较小。有代表性的视频数据集,如UCF101[21]和HMDB-51[17],可以用来提供大小约为10 K的真实视频,但即使它们仍然用作标准基准,这些数据集显然太小,无法用于从头优化CNN表示。在过去几年中,ActivityNet [5],这是一个稍大的视频数据集,已经可用,它的使用使得有可能完成其他任务,如未修剪的动作分类和检测,但它包含的动作实例的数量 仍然有限。Kinetics数据集[16]的定位是视频数据集标准,大致相当于ImageNet与图像数据集相关的位置。为Kinetics 数据集收集了超过300K的视频,这意味着视频数据集的规模已经开始接近图像数据集的规模。对于动作识别,时空三维(3d)卷积核CNN比二维(2d)CNN更有效。从几年前的[14]开始,三维CNN被探索为精确的动作识别提供了一个有效的工具。然而,即使使用组织良好的模型[23,25]也未能克服基于二维CNN的优势,后者结合了叠加流和RGB图像[20](这句话是说早期的3DCNN效果不如two-stream模型)。这种失败的主要原因是视频数据集的数据规模相对较小,可用于优化3D CNN中的大量参数,这些参数比2D CNN大得多。此外,基本上,3D CNN只能在视频数据集上进行训练,而2D CNN可以在ImageNet上进行预训练。然而,最近,Carreira和Zisserman利用kinetics数据集以及在Imagenet上预训练的二维核膨胀为三维核取得了重大突破[2](这里是说I3D)。因此,我们现在可以获得可以由Kinetics数据集参与的复杂3D卷积。

但是,3D CNN可以追溯2D CNN和ImageNet的成功历史吗? 更具体地说,使用在Kinetics上训练的3D CNN可以在动作识别和其他各种任务中产生重大进展吗? (见图1中的底行)。为了实现这一进展,我们认为Kinetics 应该像ImageNet 一样大,传统的三维CNN结构在Kinetics 上的训练仍然相对较浅(10[16]、22[2]和34[9,24]层)。如果使用Kinetics 数据集可以使非常深的3D CNN达到类似于ImageNet的水平,后者可以训练152层2D CNN[10],那么这个问题可以得到肯定的回答。

在这项研究中,我们使用Kinetics 和其他流行的视频数据集(UCF-101、HMDB-51和ActivityNet),从相对较浅的到非常深的研究各种3D CNN架构,以便为我们回答上述问题提供见解。本研究中测试的3D CNN架构基于残差网络(resnets)[10]及其扩展版本[11、12、30、31],因为它们具有简单有效的结构。因此,使用这些数据集,我们进行了几个实验,旨在从头开始训练和测试这些架构(包含微调)。这些实验的结果(详见第4节)显示,Kinetics数据集可以将3D ResNet-152从头开始训练到与ImageNet上2D ResNets完成的训练相似的水平,如图2所示。基于这些结果,我们将讨论未来在行动识别和其他视频任务中取得进展的可能性。

据我们所知,这是第一个专注于从零开始对非常深的3D CNN进行动作识别训练的工作。先前的研究表明,在ImageNet上训练的更深入的二维CNN获得了更好的性能[10]。然而,由于图像数据集的数据尺度与视频数据集的数据尺度不同,因此在以往的研究基础上,更深入地展示三维CNN的优越性并非易事。本研究的结果表明,较深的三维CNN更有效,有望促进视频计算机视觉的进一步发展。

2. Related Work

2.1. Video Datasets

HMDB-51 [17]和UCF-101 [21]数据集目前在动作识别领域是最成功的。这些数据集在该领域的早期获得了显著的普及,并且仍然被用作流行的基准。然而,最近出现了一个共识,表明它们根本不足以从头开始对深度CNN进行培训[16]。

在引入上述数据集的几年后,产生了更大的视频数据集。其中包括ActivityNet [5],其中包含849小时的视频,包括28,000个动作实例。 ActivityNet还提供了一些额外的任务,例如未修剪的分类和检测,但动作实例的数量仍然在数万个数量级。今年(2017),为了创建一个成功的预训练模型,Kay等人发布了Kinetics 数据集[16]。Kinetics 数据集包括超过30万个包含400个类别的视频剪辑。为了确定它是否可以训练更深层次的三维CNNs,我们使用这些最新的数据集,以及UCF-101和HMDB-51数据集进行了大量的实验。

其他大型数据集,如Sports-1M[15]和YouTube-8M[1]也已被提出。尽管这些数据库比Kinetics 数据库大,但它们的注释有点嘈杂,只分配了视频级标签。(换句话说,它们包括与目标动作无关的帧。)这种噪声和不相关的帧的存在有可能阻止这些模型提供良好的培训。此外,由于文件大小超过10 TB,它们的规模太大,无法方便地使用。由于这些问题,我们将避免在本研究中讨论这些数据集。

2.2. Action Recognition Approaches

基于CNN的动作识别最流行的方法之一是two-stream网络,在他们的研究中,Simonyan等人提出了一种分别使用RGB和叠层光流帧作为外观和运动信息的方法[20],表明将这两种流结合起来可以提高动作识别的精度。自那项研究以来,人们提出了许多基于两流CNN的方法来提高动作识别性能[6、7、8、27、28、29]。

与上述方法不同,我们关注的是具有三维卷积核的CNN,最近通过使用大规模视频数据集,这些核已经开始优于二维CNN。这些三维CNN直观有效,因为这种三维卷积可以直接从原始视频中提取时空特征。例如,Ji等人提出应用3D卷积从视频中提取时空特征,而Tran等人 训练的3D CNN,他们称之为C3D,使用Sports1M数据集[15]。 自那项研究以来,C3D一直被视为3D CNN的事实标准。 他们还通过实验发现3×3×3卷积内核达到了最佳性能水平。 在另一项研究中,Varol等人表明扩大C3D输入的时间长度可以提高识别性能[25]。 这些作者还发现,使用光流作为3D CNN的输入导致比从RGB输入获得的更高水平的性能,但是通过组合RGB和光流可以实现最佳性能。同时,凯等人表明,在他们的kinetics数据集上从头开始训练的3D CNN的结果与在ImageNet上预训练的2D CNN的结果相当,即使在UCF101和HMDB51数据集上训练的3D CNN的结果不如2D CNN结果。在另一项研究中,Carreira等人提出了初始[22]为基础的三维CNN,他们称之为i3d,并实现了最先进的性能[2]。最近,一些研究将Resnet体系结构引入到3DCNN中[9,24],尽管它们只研究了相对较浅的体系结构。

3. Experimental configuration

3.1. Summary

在这项研究中,为了确定当前视频数据集是否有足够的数据用于深3D CNN的训练,我们使用UCF-101 [21],HMDB-51 [17],ActivityNet [5],kinetics[16]进行了下述三个实验 。我们首先研究了在每个视频数据集上从零开始训练相对较浅的3D CNNs。根据以往的工作[9,16],在UCF-101、HMDB-51、ActivityNet上训练的三维CNNs精度不高,而在kinetics上训练的CNNs效果良好。我们尝试重现这些结果以确定数据集是否具有足够的深3D CNN数据。 具体来说,我们使用ResNet-18,它是最浅的ResNet架构,基于如下假设:如果ResNet-18在数据集上训练时过度拟合,那么该数据集太小而无法用于从头开始训练深度3D CNN。 详细信息请参见4.1节。

然后,我们进行了一项单独的实验,以确定kinetics数据集是否可以训练更深的3D CNN。该试验的主要目的是确定数据集可以训练3D CNN的深度。 因此,我们在kinetics上训练3D ResNets,同时将模型深度从18变为200.如果Kinetics可以训练非常深的CNN,例如ResNet-152,它在ImageNet上的ResNets中实现了最佳性能[10],我们可以确信 他们有足够的数据来训练3D CNN。 因此,预计该实验的结果对于动作识别和其他视频任务的未来进展非常重要。 详细信息请参见第4.2节。

在最后的实验中,我们检查了UCF-101和HMDB-51上kinetics预训练3D CNN的微调。由于在大规模数据集上预训练是在小数据集上实现良好性能水平的有效方法,我们期望在kinetics上预训练的深度 3D ResNets在相对较小的UCF-101和HMDB-51上表现良好。此实验检查深度3D CNN从一个域到另一个域的转移视觉表示是否有效。 详细信息请参见第4.3节。

3.2. Network architectures

接下来,我们解释了本研究中使用的各种基于resnet的三维卷积架构。Resnet是图像分类中最成功的体系结构之一,它提供了快捷连接,允许信号绕过一层并按顺序移动到下一层。由于这些连接通过网络的梯度流从后面的层到早期层,它们可以促进非常深的网络的训练。与以往只研究有限的3D ResNet架构不同[9,24],我们不仅研究了更深层次的架构,还研究了一些扩展版本的ResNet。我们探索以下架构:ResNet (basic and bottleneck blocks) [10], pre-activation ResNet [11], wideResNet (WRN) [31], ResNeXt [30], and DenseNet [12].架构总结在图3和表1中。

下面介绍几种架构:

basic ResNets块由两个卷积层组成,每个卷积层之后是BN和ReLU。快捷通道将块的顶部连接到块中最后一个ReLU之前的层(如下图)。ResNet-18和34采用基本块。我们使用identity 连接和零填充作为基本块的shortcuts(在[10]中键入a),以避免增加这些相对较浅网络的参数数量。

ResNets bottleneck 块由三个卷积层组成。 第一和第三卷积层的内核大小是1×1×1,而第二卷的内核大小是3×3×3。该块的快捷方式与基本块的快捷方式相同。 ResNet-50,101,152和200采用了bottleneck 。 我们使用identity连接,除了那些用于增加维度的连接([10]中的类型B)。

预激活ResNet类似于bottleneck ResNet架构,但在卷积,批量标准化和ReLU顺序方面存在差异。在ResNet中,每个卷积层之后是BN和ReLU,而预激活ResNet的每个BN之后是ReLU和卷积层。快捷方式传递将块的顶部连接到块中最后一个卷积层之后的层,如下图。

表明这种预激活有利于训练中的优化并减少过度拟合[11]。 在本研究中,评估了预激活ResNet-200。

WRN架构与ResNet(瓶颈)相同,但每个卷积层的特征映射数量存在差异。WRN增加了特征映射的数量而不是层数。 这种宽体系结构在使用GPU的并行计算中是有效的[31]。 在本研究中,我们使用扩展因子2来评估WRN-50。

resnext引入了基数,这是一个不同于更深和更宽的维度。与原来的瓶颈块不同,resnext块引入了组卷积,将特征映射分成小组。基数是指bottleneck 块中的中间卷积层组的数量。表明增加2D架构的基数比使用更宽或更深的架构更有效[30]。 在本研究中,我们使用32的基数来评估ResNeXt-101。

DenseNet通过使用与ResNets求和不同的串联来建立从早期层到后期层的连接。这种连接以前馈方式密集地连接每一层。 DenseNets还采用预激活ResNets中使用的预激活。 在他们的研究中,表明它比ResNets [12]用更少的参数实现更好的精度。 在本研究中,我们使用32的增长率评估DenseNet-121和201。

3.3. Implementation

Training.我们使用带动量的随机梯度下降来训练网络,并从训练数据中的视频中随机生成训练样本,以便执行数据增强。首先,我们通过均匀采样在视频中选择时间位置,以生成训练样本。然后在所选择的时间位置周围生成16帧剪辑。如果视频短于16帧,则根据需要将其循环多次。接下来,我们从四个角或中心随机选择一个空间位置。除了空间位置,我们还选择了样本的空间尺度,以便进行多尺度裁剪。使用的流程步骤与[28]相同。 比例选自

标度1表示样品宽度和高度与帧的短边长度相同,标度0.5表示样品是短边长度的一半。样本纵横比为1,在位置、尺度和长径比上进行时空裁剪。我们在空间上调整样本的大小为112×112像素。 每个样本的大小是3个通道×16个帧×112个像素×112个像素,并且每个样本以50%的概率水平翻转。我们还执行平均减法,这意味着我们从样本的每个颜色通道减去activitynet的平均值。所有生成的示例保留与原始视频相同的类标签。

在我们的训练中,我们使用交叉熵损失并反向传播它们的梯度。 训练参数包括动量的0.9和0.001的权重衰减。当从头开始训练网络时,我们从学习率0.1开始,并在验证损失饱和后将其除以10。在进行微调时,我们从0.001的学习率开始,并指定1e-5的权重衰减。

Recognition。我们采用滑动窗口方式来生成输入剪辑(即,每个视频被分成非重叠的16帧剪辑),并使用训练的网络识别视频中的动作。每个剪辑在中心位置周围以比例1进行空间裁剪。然后我们将每个剪辑输入到网络中并估计剪辑类别分数,这些分数在视频的所有剪辑上取平均值。 具有最高分数的类表示已识别的类标签。

3.4. Datasets

UCF-101包括来自101个人类行动类的13,320个动作实例。 视频在时间上被修剪以移除非动作帧。 每个视频的平均持续时间约为7秒。 数据集中提供了三个训练/测试分组(70%训练和30%测试)。

HMDB-51包括来自51个人类行动课程的6,766个视频。 与UCF-101类似,视频在时间上被修剪。 每个视频的平均持续时间约为3秒。 该数据集中提供了三次训练/测试分组(70%训练和30%测试)。ActivityNet(v1.3)提供了200个人类行为类的样本,每个类平均有137个未修剪的视频,每个视频有1.41个活动实例。 与其他数据集不同,ActivityNet由未修剪的视频组成,其中包括非动作帧。 总视频长度为849小时,动作实例总数为28,108。该数据集随机分为三个不同的子集:训练,验证和测试。 更具体地说,50%用于训练,25%用于验证,25%用于测试。

ActivityNet(v1.3)提供了200个人类行为类的样本,每个类平均有137个未修剪的视频,每个视频有1.41个活动实例。 与其他数据集不同,ActivityNet由未修剪的视频组成,其中包括非动作帧。 总视频长度为849小时,动作实例总数为28,108。该数据集随机分为三个不同的子集:训练,验证和测试。 更具体地说,50%用于训练,25%用于验证,25%用于测试。

Kinetics数据集有400个人类动作类,每个类包含400多个视频。 视频在时间上被修剪,持续约10秒钟。 视频总数超过300,000。 培训,验证和测试集的数量分别约为240,000,20,000和40,000。所有这些数据集的视频属性都类似。 大多数视频都是从YouTube中提取的,HMDB-51除外,其中包括从电影中提取的视频。视频包括动态背景和摄像机动作,它们之间的主要区别在于动作类和实例的数量。我们将视频调整为240像素的高度,而不更改其宽高比,然后存储它们。

4. Results and discussion

4.1. Analyses of training on each dataset

我们首先在每个数据集上训练ResNet-18。 根据以前的工作[9,16],在UCF-101,HMDB-51和ActivityNet上训练的3D CNN不能达到高精度,而在Kinetics上训练的3D CNN运行良好。我们试图在这个实验中重现这样的结果。 在这个过程中,我们使用了UCF-101和HMDB-51的分组1,以及ActivityNet和Kinetics的训练和验证集。

图4显示了ResNet-18在每个数据集上的训练和验证损失。从图中可以看出,UCF-101、HMDB-51和ActivityNet上的验证损失迅速收敛到高值,明显高于相应的训练损失(过拟合的症状)。

这些结果表明,在对这三个数据集进行培训时会产生过度拟合。除了这些损失之外,我们还确认了每个剪辑的准确度,这些精度是针对每个剪辑而不是针对每个视频进行评估的。UCF-101,HMDB51和ActivityNet的验证准确度分别为40.1%,16.2%和26.8%。应该指出的是,我们的结果与以前的研究结果之间的直接比较是不公平的,因为大多数论文中报告的准确度是每视频的准确度。然而,由于这些精度与早期方法相比非常低[5,26],我们的结果表明很难在UCF-101,HMDB-51和ActivityNet上从头开始训练深度3D CNN。

相比之下,Kinetics的训练和验证损失与其他数据集上的显着不同。 由于验证损失略高于训练损失,我们可以得出结论,在Kinetics上训练ResNet-18不会导致过度拟合,并且Kinetics有可能训练深3D CNN。 在下一节中,我们将进一步研究Kinetics上更深入的3D CNN。

4.2. Analyses of deeper networks

在这里,我们将根据模型深度显示ResNets精度的变化。 图2显示了前1和前5的平均精度。我们可以看到,基本上,随着深度的增加,精度得到提高,并且改进持续到152深度。与ResNet-18相比,更深层次的ResNet-152实现了显着的精度提高,与ResNet-18相比,更深层次的ResNet-152实现了显着的精度提高,相比之下,ResNet-200的准确度几乎与ResNet-152的准确度相同。这一结果表明ResNet-200的培训开始过度拟合。 有趣的是,结果类似于ImageNet上的2D ResNets [11]。 更具体地说,2D和3D ResNets的精度随着深度的增加而提高,直到达到152的深度,然后当增加200的深度时精度没有增加。这些结果表明,动力学数据集具有足够的数据来以类似于ImageNet的方式训练3D CNN。

4.3. Analyses of fine-tuning

5. Conclusion

在这项研究中,我们在当前视频数据集上检查了具有时空3D卷积核的各种CNN的体系结构。 根据这些实验的结果,可以得到以下结论:

(i)ResNet-18培训导致UCF-101,HMDB-51和ActivityNet的严重过度拟合,但对于kinetics则没有。

(ii)Kinetics数据集具有足够的数据用于深3D CNN的训练,并且能够训练多达152个ResNets层,有趣地类似于ImageNet上的2D ResNets。

(iii)kinetics预训练的简单3D体系结构优于UCF-101和HMDB-51上的复杂2D体系结构,预训练的ResNeXt-101分别在UCF-101和HMDB-51上实现了94.5%和70.2%。

我们相信,这项研究的结果将有助于进一步推进视频识别及其相关任务。随着二维CNNs和ImageNet在图像识别方面的显著进步,在ImageNet上预先训练的二维CNNs在目标检测、语义分割和图像字幕等各项任务上都取得了显著进展。与此类似,3D CNN和kinetics有可能在与各种视频任务(如动作检测、视频总结和光流估计)相关的领域取得重大进展。在我们未来的工作中,我们将研究转移学习,不仅是为了行动识别,也为了其他类似的任务。

3D校验码是什么意思:什么是三维码?

原理上应该就是在二维码每个色块只能表示0和1的基础上,加入了颜色这个维度,感觉这是一种理解,不知道对不对

3D校验码是什么意思:3D对应码是什么意思?

对应码和对补码是开奖号码中必须存在的,没有它的存在就不存在号码,这是我们经常用到的东西,千万不能忽视

3D校验码是什么意思:3D对应码是什么意思?

原来的电影都是用胶片来放映的,而数字是用硬盘来拷贝的,比原来的要清晰,更容易保存一点,现在的3D电影都是数字的,没有胶片的,都要戴上3D眼镜以后才能看出效果,3D电影的话那就是数字3D电影了。

Tags:

搜索
网站分类
标签列表