颜色分类leetcode Real time GesRec 在EgoGesture、NvGesture、Jester、Kinet...
颜色分类leetcode使用3D CNN进行实时手势识别文章和的PyTorch实现、代码和预训练模型。图:显示了具有来自EgoGesture数据集(左侧)的输入视频和每个手势的实时(在线)分类分数(右侧)的架构的实时模拟,其中每个类都用不同的颜色进行了注释。此代码包括对EgoGesture和nvGesture数据集的训练、微调和测试。注意代码只包含ResNet-10、ResNetL-10、ResneXt-101、C3D v1,其他版本可以轻松添加。抽象的从视频流中实时识别动态手势是一项具有挑战性的任务,因为(i)在视频中没有手势开始和结束的指示,(ii)执行的手势应该只识别一次,以及(iii)整个架构的设计应考虑内存和功率预算。在这项工作中,我们通过提出一种分层结构来解决这些挑战,该结构使离线工作的卷积神经网络(CNN)架构能够通过使用滑动窗口方法有效地在线运行。所提出的架构由两个模型组成:(1)检测器是一种轻量级的CNN架构,用于检测手势;(2)分类器是一种深度CNN,用于对检测到的手势进行分类。为了评估检测到的手势的单次
用户评论