可变形卷积网络:计算机新“视”界

2017年,微软亚洲研究院视觉计算组的研究员在 arXiv 上公布了一篇题为 “Deformable Convolutional Networks”(可变形卷积网络) 的论文,首次在卷积神经网络(convolutional neutral networks,CNN)中引入了学习空间几何形变的能力,得到可变形卷积网络(deformable convolutional networks),从而更好地解决了具有空间形变的图像识别任务。

研究员们通过大量的实验结果验证了该方法在复杂的计算机视觉任务(如目标检测和语义分割)上的有效性,首次表明在深度卷积神经网络(deep CNN)中学习空间上密集的几何形变是可行的。

阅读全文

Faster-rcnn 里的区域生成网络(RPN)

我觉得 RPN 是目标检测领域里最经典也是最容易入门的网络了。如果你想学好目标检测,那一定不能不知道它!今天讲的 RPN 是来一篇来自 CVPR 2017 的论文 Expecting the Unexpected: Training Detectors for Unusual Pedestrians with Adversarial Imposters, 作者在 Faster-rcnn 的 RPN 基础上进行了改进,用于行人检测。

阅读全文

全卷积神经网络(FCN)

在我还是实习生的时候,我们组的 leader 讲了 FCN 网络。由于当时对图像分割还不是很了解,所以也没太听懂,只记得他当时讲这篇文章拿了 CVPR-2015 的最佳论文奖。现在学习 FCN 就觉得,这应该是图像分割领域里最经典也是最适合入门的网络了吧。

阅读全文

批量归一化层(Batch Normalization)

通常来说,数据标准化预处理对于浅层模型就足够有效了。但随着模型训练的进行,当每层中参数更新时,靠近输出层的输出容易出现剧烈变化。这令我们难以训练出有效的深度模型,而批量归一化(batch normalization)的提出正是为了应对这种挑战。

阅读全文

TensorFlow 模型转化 tflite

自从有了TensorFlow Lite,应用开发者可以在移动设备上很轻松地部署神经网络。

阅读全文

YOLOv3 算法的一点理解

今天讲一讲 YOLOv3, 目标检测网络的巅峰之作, 疾如风,快如闪电。

阅读全文

医学图片分割网络 —— Unet

Unet 是 Kaggle 语义分割挑战赛上的常客。因为它简单,高效,易懂,容易定制,最主要的是它可以从相对较小的数据集中学习。在医学图像处理领域,各路高手更是拿着 Unet 各种魔改。

阅读全文

使用 Pytorch 对 mnist 数字进行分类

一直以来就非常喜欢 Pytorch,今天就小试牛刀一下,用它实现对 mnist 数字进行分类。

阅读全文

FAST 角点检测

FAST 是一种角点,主要检测局部像素灰度变化明显的地方,以速度快著称。它的思想是: 如果一个像素与它邻域的像素差别较大(过亮或过暗), 那它更可能是角点。相比于其他角点检测算法,FAST 只需比较像素亮度的大小, 十分快捷。它的检测过程如下:

阅读全文

Pytorch 的数据集准备

深度学习的绝大部分工作都是在准备数据集,Pytorch 提供了很多工具使数据加载变得更简单。在本节内容中,我们来看看是如何利用 torch.utils.data.DataLoader 加载数据集的。

首先需要 import 一些必要的库:

import os
import torch
import skimage
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from torchvision import transforms, utils
from torch.utils.data import Dataset, DataLoader

然后从这里下载一个名为 faces 的文件夹,该文件夹里包含了一些 68 个特征点(part_0 ~ part_67) 的人脸图片和 face_landmarks.csv

阅读全文