计算机视觉
图像处理

机器视觉开源代码集合

周涛阅读(213)评论(0)

一、特征提取Feature Extraction:

二、图像分割Image Segmentation:

  • Normalized Cut [1] [Matlab code]
  • Gerg Mori’ Superpixel code [2] [Matlab code]
  • Efficient Graph-based Image Segmentation [3] [C++ code] [Matlab wrapper]
  • Mean-Shift Image Segmentation [4] [EDISON C++ code] [Matlab wrapper]
  • OWT-UCM Hierarchical Segmentation [5] [Resources]
  • Turbepixels [6] [Matlab code 32bit] [Matlab code 64bit] [Updated code]
  • Quick-Shift [7] [VLFeat]
  • SLIC Superpixels [8] [Project]
  • Segmentation by Minimum Code Length [9] [Project]
  • Biased Normalized Cut [10] [Project]
  • Segmentation Tree [11-12] [Project]
  • Entropy Rate Superpixel Segmentation [13] [Code]
  • Fast Approximate Energy Minimization via Graph Cuts[Paper][Code]
  • Efficient Planar Graph Cuts with Applications in Computer Vision[Paper][Code]
  • Isoperimetric Graph Partitioning for Image Segmentation[Paper][Code]
  • Random Walks for Image Segmentation[Paper][Code]
  • Blossom V: A new implementation of a minimum cost perfect matching algorithm[Code]
  • An Experimental Comparison of Min-Cut/Max-Flow Algorithms for Energy Minimization in Computer Vision[Paper][Code]
  • Geodesic Star Convexity for Interactive Image Segmentation[Project]
  • Contour Detection and Image Segmentation Resources[Project][Code]
  • Biased Normalized Cuts[Project]
  • Max-flow/min-cut[Project]
  • Chan-Vese Segmentation using Level Set[Project]
  • A Toolbox of Level Set Methods[Project]
  • Re-initialization Free Level Set Evolution via Reaction Diffusion[Project]
  • Improved C-V active contour model[Paper][Code]
  • A Variational Multiphase Level Set Approach to Simultaneous Segmentation and Bias Correction[Paper][Code]
  • Level Set Method Research by Chunming Li[Project]
  • ClassCut for Unsupervised Class Segmentation[code]
  • SEEDS: Superpixels Extracted via Energy-Driven Sampling [Project][other]

三、目标检测Object Detection:

  • A simple object detector with boosting [Project]
  • INRIA Object Detection and Localization Toolkit [1] [Project]
  • Discriminatively Trained Deformable Part Models [2] [Project]
  • Cascade Object Detection with Deformable Part Models [3] [Project]
  • Poselet [4] [Project]
  • Implicit Shape Model [5] [Project]
  • Viola and Jones’s Face Detection [6] [Project]
  • Bayesian Modelling of Dyanmic Scenes for Object Detection[Paper][Code]
  • Hand detection using multiple proposals[Project]
  • Color Constancy, Intrinsic Images, and Shape Estimation[Paper][Code]
  • Discriminatively trained deformable part models[Project]
  • Gradient Response Maps for Real-Time Detection of Texture-Less Objects: LineMOD [Project]
  • Image Processing On Line[Project]
  • Robust Optical Flow Estimation[Project]
  • Where’s Waldo: Matching People in Images of Crowds[Project]
  • Scalable Multi-class Object Detection[Project]
  • Class-Specific Hough Forests for Object Detection[Project]
  • Deformed Lattice Detection In Real-World Images[Project]
  • Discriminatively trained deformable part models[Project]

四、显著性检测Saliency Detection:

  • Itti, Koch, and Niebur’ saliency detection [1] [Matlab code]
  • Frequency-tuned salient region detection [2] [Project]
  • Saliency detection using maximum symmetric surround [3] [Project]
  • Attention via Information Maximization [4] [Matlab code]
  • Context-aware saliency detection [5] [Matlab code]
  • Graph-based visual saliency [6] [Matlab code]
  • Saliency detection: A spectral residual approach. [7] [Matlab code]
  • Segmenting salient objects from images and videos. [8] [Matlab code]
  • Saliency Using Natural statistics. [9] [Matlab code]
  • Discriminant Saliency for Visual Recognition from Cluttered Scenes. [10] [Code]
  • Learning to Predict Where Humans Look [11] [Project]
  • Global Contrast based Salient Region Detection [12] [Project]
  • Bayesian Saliency via Low and Mid Level Cues[Project]
  • Top-Down Visual Saliency via Joint CRF and Dictionary Learning[Paper][Code]
  • Saliency Detection: A Spectral Residual Approach[Code]

五、图像分类、聚类Image Classification, Clustering

  • Pyramid Match [1] [Project]
  • Spatial Pyramid Matching [2] [Code]
  • Locality-constrained Linear Coding [3] [Project] [Matlab code]
  • Sparse Coding [4] [Project] [Matlab code]
  • Texture Classification [5] [Project]
  • Multiple Kernels for Image Classification [6] [Project]
  • Feature Combination [7] [Project]
  • SuperParsing [Code]
  • Large Scale Correlation Clustering Optimization[Matlab code]
  • Detecting and Sketching the Common[Project]
  • Self-Tuning Spectral Clustering[Project][Code]
  • User Assisted Separation of Reflections from a Single Image Using a Sparsity Prior[Paper][Code]
  • Filters for Texture Classification[Project]
  • Multiple Kernel Learning for Image Classification[Project]
  • SLIC Superpixels[Project]

六、抠图Image Matting

  • A Closed Form Solution to Natural Image Matting [Code]
  • Spectral Matting [Project]
  • Learning-based Matting [Code]

七、目标跟踪Object Tracking:

  • A Forest of Sensors – Tracking Adaptive Background Mixture Models [Project]
  • Object Tracking via Partial Least Squares Analysis[Paper][Code]
  • Robust Object Tracking with Online Multiple Instance Learning[Paper][Code]
  • Online Visual Tracking with Histograms and Articulating Blocks[Project]
  • Incremental Learning for Robust Visual Tracking[Project]
  • Real-time Compressive Tracking[Project]
  • Robust Object Tracking via Sparsity-based Collaborative Model[Project]
  • Visual Tracking via Adaptive Structural Local Sparse Appearance Model[Project]
  • Online Discriminative Object Tracking with Local Sparse Representation[Paper][Code]
  • Superpixel Tracking[Project]
  • Learning Hierarchical Image Representation with Sparsity, Saliency and Locality[Paper][Code]
  • Online Multiple Support Instance Tracking [Paper][Code]
  • Visual Tracking with Online Multiple Instance Learning[Project]
  • Object detection and recognition[Project]
  • Compressive Sensing Resources[Project]
  • Robust Real-Time Visual Tracking using Pixel-Wise Posteriors[Project]
  • Tracking-Learning-Detection[Project][OpenTLD/C++ Code]
  • the HandVu:vision-based hand gesture interface[Project]
  • Learning Probabilistic Non-Linear Latent Variable Models for Tracking Complex Activities[Project]

八、Kinect:

九、3D相关:

  • 3D Reconstruction of a Moving Object[Paper] [Code]
  • Shape From Shading Using Linear Approximation[Code]
  • Combining Shape from Shading and Stereo Depth Maps[Project][Code]
  • Shape from Shading: A Survey[Paper][Code]
  • A Spatio-Temporal Descriptor based on 3D Gradients (HOG3D)[Project][Code]
  • Multi-camera Scene Reconstruction via Graph Cuts[Paper][Code]
  • A Fast Marching Formulation of Perspective Shape from Shading under Frontal Illumination[Paper][Code]
  • Reconstruction:3D Shape, Illumination, Shading, Reflectance, Texture[Project]
  • Monocular Tracking of 3D Human Motion with a Coordinated Mixture of Factor Analyzers[Code]
  • Learning 3-D Scene Structure from a Single Still Image[Project]

十、机器学习算法:

  • Matlab class for computing Approximate Nearest Nieghbor (ANN) [Matlab class providing interface toANN library]
  • Random Sampling[code]
  • Probabilistic Latent Semantic Analysis (pLSA)[Code]
  • FASTANN and FASTCLUSTER for approximate k-means (AKM)[Project]
  • Fast Intersection / Additive Kernel SVMs[Project]
  • SVM[Code]
  • Ensemble learning[Project]
  • Deep Learning[Net]
  • Deep Learning Methods for Vision[Project]
  • Neural Network for Recognition of Handwritten Digits[Project]
  • Training a deep autoencoder or a classifier on MNIST digits[Project]
  • THE MNIST DATABASE of handwritten digits[Project]
  • Ersatz:deep neural networks in the cloud[Project]
  • Deep Learning [Project]
  • sparseLM : Sparse Levenberg-Marquardt nonlinear least squares in C/C++[Project]
  • Weka 3: Data Mining Software in Java[Project]
  • Invited talk “A Tutorial on Deep Learning” by Dr. Kai Yu (余凯)[Video]
  • CNN – Convolutional neural network class[Matlab Tool]
  • Yann LeCun’s Publications[Wedsite]
  • LeNet-5, convolutional neural networks[Project]
  • Training a deep autoencoder or a classifier on MNIST digits[Project]
  • Deep Learning 大牛Geoffrey E. Hinton’s HomePage[Website]
  • Multiple Instance Logistic Discriminant-based Metric Learning (MildML) and Logistic Discriminant-based Metric Learning (LDML)[Code]
  • Sparse coding simulation software[Project]
  • Visual Recognition and Machine Learning Summer School[Software]

十一、目标、行为识别Object, Action Recognition:

  • Action Recognition by Dense Trajectories[Project][Code]
  • Action Recognition Using a Distributed Representation of Pose and Appearance[Project]
  • Recognition Using Regions[Paper][Code]
  • 2D Articulated Human Pose Estimation[Project]
  • Fast Human Pose Estimation Using Appearance and Motion via Multi-Dimensional Boosting Regression[Paper][Code]
  • Estimating Human Pose from Occluded Images[Paper][Code]
  • Quasi-dense wide baseline matching[Project]
  • ChaLearn Gesture Challenge: Principal motion: PCA-based reconstruction of motion histograms[Project]
  • Real Time Head Pose Estimation with Random Regression Forests[Project]
  • 2D Action Recognition Serves 3D Human Pose Estimation[Project]
  • A Hough Transform-Based Voting Framework for Action Recognition[Project]
  • Motion Interchange Patterns for Action Recognition in Unconstrained Videos[Project]
  • 2D articulated human pose estimation software[Project]
  • Learning and detecting shape models [code]
  • Progressive Search Space Reduction for Human Pose Estimation[Project]
  • Learning Non-Rigid 3D Shape from 2D Motion[Project]

十二、图像处理:

  • Distance Transforms of Sampled Functions[Project]
  • The Computer Vision Homepage[Project]
  • Efficient appearance distances between windows[code]
  • Image Exploration algorithm[code]
  • Motion Magnification 运动放大 [Project]
  • Bilateral Filtering for Gray and Color Images 双边滤波器 [Project]
  • A Fast Approximation of the Bilateral Filter using a Signal Processing Approach [Project]

十三、一些实用工具:

  • EGT: a Toolbox for Multiple View Geometry and Visual Servoing[Project] [Code]
  • a development kit of matlab mex functions for OpenCV library[Project]
  • Fast Artificial Neural Network Library[Project]

十四、人手及指尖检测与识别:

  • finger-detection-and-gesture-recognition [Code]
  • Hand and Finger Detection using JavaCV[Project]
  • Hand and fingers detection[Code]

十五、场景解释:

  • Nonparametric Scene Parsing via Label Transfer [Project]

十六、光流Optical flow:

  • High accuracy optical flow using a theory for warping [Project]
  • Dense Trajectories Video Description [Project]
  • SIFT Flow: Dense Correspondence across Scenes and its Applications[Project]
  • KLT: An Implementation of the Kanade-Lucas-Tomasi Feature Tracker [Project]
  • Tracking Cars Using Optical Flow[Project]
  • Secrets of optical flow estimation and their principles[Project]
  • implmentation of the Black and Anandan dense optical flow method[Project]
  • Optical Flow Computation[Project]
  • Beyond Pixels: Exploring New Representations and Applications for Motion Analysis[Project]
  • A Database and Evaluation Methodology for Optical Flow[Project]
  • optical flow relative[Project]
  • Robust Optical Flow Estimation [Project]
  • optical flow[Project]

十七、图像检索Image Retrieval:

  • Semi-Supervised Distance Metric Learning for Collaborative Image Retrieval [Paper][code]

十八、马尔科夫随机场Markov Random Fields:

  • Markov Random Fields for Super-Resolution [Project]
  • A Comparative Study of Energy Minimization Methods for Markov Random Fields with Smoothness-Based Priors [Project]

十九、运动检测Motion detection:

  • Moving Object Extraction, Using Models or Analysis of Regions [Project]
  • Background Subtraction: Experiments and Improvements for ViBe [Project]
  • A Self-Organizing Approach to Background Subtraction for Visual Surveillance Applications [Project]
  • changedetection.net: A new change detection benchmark dataset[Project]
  • ViBe – a powerful technique for background detection and subtraction in video sequences[Project]
  • Background Subtraction Program[Project]
  • Motion Detection Algorithms[Project]
  • Stuttgart Artificial Background Subtraction Dataset[Project]
  • Object Detection, Motion Estimation, and Tracking[Project]

Feature Detection and DescriptionGeneral Libraries: 

  • VLFeat – Implementation of various feature descriptors (including SIFT, HOG, and LBP) and covariant feature detectors (including DoG, Hessian, Harris Laplace, Hessian Laplace, Multiscale Hessian, Multiscale Harris). Easy-to-use Matlab interface. See Modern features: Software – Slides providing a demonstration of VLFeat and also links to other software. Check also VLFeat hands-on session training
  • OpenCV – Various implementations of modern feature detectors and descriptors (SIFT, SURF, FAST, BRIEF, ORB, FREAK, etc.)

Fast Keypoint Detectors for Real-time Applications: 

  • FAST – High-speed corner detector implementation for a wide variety of platforms
  • AGAST – Even faster than the FAST corner detector. A multi-scale version of this method is used for the BRISK descriptor (ECCV 2010).

Binary Descriptors for Real-Time Applications: 

  • BRIEF – C++ code for a fast and accurate interest point descriptor (not invariant to rotations and scale) (ECCV 2010)
  • ORB – OpenCV implementation of the Oriented-Brief (ORB) descriptor (invariant to rotations, but not scale)
  • BRISK – Efficient Binary descriptor invariant to rotations and scale. It includes a Matlab mex interface. (ICCV 2011)
  • FREAK – Faster than BRISK (invariant to rotations and scale) (CVPR 2012)

SIFT and SURF Implementations: 

Other Local Feature Detectors and Descriptors: 

  • VGG Affine Covariant features – Oxford code for various affine covariant feature detectors and descriptors.
  • LIOP descriptor – Source code for the Local Intensity order Pattern (LIOP) descriptor (ICCV 2011).
  • Local Symmetry Features – Source code for matching of local symmetry features under large variations in lighting, age, and rendering style (CVPR 2012).

Global Image Descriptors: 

  • GIST – Matlab code for the GIST descriptor
  • CENTRIST – Global visual descriptor for scene categorization and object detection (PAMI 2011)

Feature Coding and Pooling 

  • VGG Feature Encoding Toolkit – Source code for various state-of-the-art feature encoding methods – including Standard hard encoding, Kernel codebook encoding, Locality-constrained linear encoding, and Fisher kernel encoding.
  • Spatial Pyramid Matching – Source code for feature pooling based on spatial pyramid matching (widely used for image classification)

Convolutional Nets and Deep Learning 

  • EBLearn – C++ Library for Energy-Based Learning. It includes several demos and step-by-step instructions to train classifiers based on convolutional neural networks.
  • Torch7 – Provides a matlab-like environment for state-of-the-art machine learning algorithms, including a fast implementation of convolutional neural networks.
  • Deep Learning – Various links for deep learning software.

Part-Based Models 

Attributes and Semantic Features 

Large-Scale Learning 

  • Additive Kernels – Source code for fast additive kernel SVM classifiers (PAMI 2013).
  • LIBLINEAR – Library for large-scale linear SVM classification.
  • VLFeat – Implementation for Pegasos SVM and Homogeneous Kernel map.

Fast Indexing and Image Retrieval 

  • FLANN – Library for performing fast approximate nearest neighbor.
  • Kernelized LSH – Source code for Kernelized Locality-Sensitive Hashing (ICCV 2009).
  • ITQ Binary codes – Code for generation of small binary codes using Iterative Quantization and other baselines such as Locality-Sensitive-Hashing (CVPR 2011).
  • INRIA Image Retrieval – Efficient code for state-of-the-art large-scale image retrieval (CVPR 2011).

Object Detection 

3D Recognition 

Action Recognition 


DatasetsAttributes 

  • Animals with Attributes – 30,475 images of 50 animals classes with 6 pre-extracted feature representations for each image.
  • aYahoo and aPascal – Attribute annotations for images collected from Yahoo and Pascal VOC 2008.
  • FaceTracer – 15,000 faces annotated with 10 attributes and fiducial points.
  • PubFig – 58,797 face images of 200 people with 73 attribute classifier outputs.
  • LFW – 13,233 face images of 5,749 people with 73 attribute classifier outputs.
  • Human Attributes – 8,000 people with annotated attributes. Check also this link for another dataset of human attributes.
  • SUN Attribute Database – Large-scale scene attribute database with a taxonomy of 102 attributes.
  • ImageNet Attributes – Variety of attribute labels for the ImageNet dataset.
  • Relative attributes – Data for OSR and a subset of PubFig datasets. Check also this link for the WhittleSearch data.
  • Attribute Discovery Dataset – Images of shopping categories associated with textual descriptions.

Fine-grained Visual Categorization 

Face Detection 

  • FDDB – UMass face detection dataset and benchmark (5,000+ faces)
  • CMU/MIT – Classical face detection dataset.

Face Recognition 

  • Face Recognition Homepage – Large collection of face recognition datasets.
  • LFW – UMass unconstrained face recognition dataset (13,000+ face images).
  • NIST Face Homepage – includes face recognition grand challenge (FRGC), vendor tests (FRVT) and others.
  • CMU Multi-PIE – contains more than 750,000 images of 337 people, with 15 different views and 19 lighting conditions.
  • FERET – Classical face recognition dataset.
  • Deng Cai’s face dataset in Matlab Format – Easy to use if you want play with simple face datasets including Yale, ORL, PIE, and Extended Yale B.
  • SCFace – Low-resolution face dataset captured from surveillance cameras.

Handwritten Digits 

  • MNIST – large dataset containing a training set of 60,000 examples, and a test set of 10,000 examples.

Pedestrian Detection

Generic Object Recognition 

  • ImageNet – Currently the largest visual recognition dataset in terms of number of categories and images.
  • Tiny Images – 80 million 32×32 low resolution images.
  • Pascal VOC – One of the most influential visual recognition datasets.
  • Caltech 101 / Caltech 256 – Popular image datasets containing 101 and 256 object categories, respectively.
  • MIT LabelMe – Online annotation tool for building computer vision databases.

Scene Recognition

Feature Detection and Description 

Action Recognition

RGBD Recognition 

Reference:  [1]: http://rogerioferis.com/VisualRecognitionAndSearch/Resources.html

________________________________________________________________________________________________

Related Courses

Deep Residual Networks

Deep Residual Learning for Image Recognition
https://github.com/KaimingHe/deep-residual-networks

Identity Mappings in Deep Residual Networks (by Kaiming He)

arxiv: http://arxiv.org/abs/1603.05027
github: https://github.com/KaimingHe/resnet-1k-layers
github: https://github.com/bazilas/matconvnet-ResNet
github: https://github.com/FlorianMuellerklein/Identity-Mapping-ResNet-Lasagne

Wide Residual Networks

arxiv: http://arxiv.org/abs/1605.07146
github: https://github.com/szagoruyko/wide-residual-networks
github: https://github.com/asmith26/wide_resnets_keras

Inception-V4, Inception-Resnet And The Impact Of Residual Connections On Learning (Workshop track – ICLR 2016)

intro: “achieve 3.08% top-5 error on the test set of the ImageNet classification (CLS) challenge”
arxiv: http://arxiv.org/abs/1602.07261
paper: http://beta.openreview.net/pdf?id=q7kqBkL33f8LEkD3t7X9
github: https://github.com/lim0606/torch-inception-resnet-v2

Object detection
Object detection via a multi-region & semantic segmentation-aware CNN model
https://github.com/gidariss/mrcnn-object-detection

DeepBox: Learning Objectness with Convolutional Networks ICCV2015
proposal re-ranker
https://github.com/weichengkuo/DeepBox

Object-Proposal Evaluation Protocol is ‘Gameable’ 好多 Proposal 代码
https://github.com/batra-mlp-lab/object-proposals

Fast R-CNN
https://github.com/rbgirshick/fast-rcnn

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
https://github.com/ShaoqingRen/faster_rcnn MATLAB
https://github.com/rbgirshick/py-faster-rcnn Python

YOLO : Real-Time Object Detection
http://pjreddie.com/darknet/yolo/
https://github.com/pjreddie/darknet

SSD: Single Shot MultiBox Detector 比Faster R-CNN又快又好啊!
https://github.com/weiliu89/caffe/tree/ssd

A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
https://github.com/zhaoweicai/mscnn

Image Question Answering
Stacked Attention Networks for Image Question Answering CVPR2016
https://github.com/zcyang/imageqa-san

Image Question Answering using Convolutional Neural Networ with Dynamic Parameter Prediction CVPR2016

项目网页
http://cvlab.postech.ac.kr/research/dppnet/
开源代码
https://github.com/HyeonwooNoh/DPPnet

场景识别:
SegNet: A Deep Convolutional Encoder-Decoder Architecture for Robust
Semantic Pixel-Wise Labelling
https://github.com/alexgkendall/caffe-segnet

Tracking:
Learning to Track: Online Multi-Object Tracking by Decision Making ICCV2015
使用 Markov Decision Processes 做跟踪,速度可能比较慢,效果应该还可以
https://github.com/yuxng/MDP_Tracking

Fully-Convolutional Siamese Networks for Object Tracking
http://www.robots.ox.ac.uk/~luca/siamese-fc.html

Car detection:
Integrating Context and Occlusion for Car Detection by Hierarchical And-or Model ECCV2014
http://www.stat.ucla.edu/~boli/projects/context_occlusion/context_occlusion.html

Face detection

人脸检测2015进展:http://www.cvrobot.net/latest-progress-in-face-detection-2015/

Face detection without bells and whistles
project:http://markusmathias.bitbucket.org/2014_eccv_face_detection/
Code:https://bitbucket.org/rodrigob/doppia
Talk: http://videolectures.net/eccv2014_mathias_face_detection/

From Facial Parts Responses to Face Detection: A Deep Learning Approach ICCV2015 email to get code and model
http://personal.ie.cuhk.edu.hk/~ys014/projects/Faceness/Faceness.html

A Fast and Accurate Unconstrained Face Detector 2015 PAMI
简单 快速 有效
http://www.cbsr.ia.ac.cn/users/scliao/projects/npdface/

Face Alignment
Face Alignment by Coarse-to-Fine Shape Searching
http://mmlab.ie.cuhk.edu.hk/projects/CFSS.html

High-Fidelity Pose and Expression Normalization for Face Recognition
in the Wild
http://www.cbsr.ia.ac.cn/users/xiangyuzhu/projects/HPEN/main.htm

Face Recognition
Deep face recognition
http://www.robots.ox.ac.uk/~vgg/software/vgg_face/

Do We Really Need to Collect Millions of Faces for Effective Face Recognition?
http://www.openu.ac.il/home/hassner/projects/augmented_faces/

Person Re-identification :

Person Re-identification Results
http://www.ssig.dcc.ufmg.br/reid-results/#ref35VIPER

Learning a Discriminative Null Space for Person Re-identification
code http://www.eecs.qmul.ac.uk/~lz/

Query-Adaptive Late Fusion for Image Search and Person Re-identification
CVPR2015
http://www.liangzheng.com.cn/Project/project_fusion.html

Efficient Person Re-identification by Hybrid Spatiogram and Covariance Descriptor CVPR2015 Workshops
https://github.com/Myles-ZMY/HSCD

Person Re-Identification by Iterative Re-Weighted Sparse Ranking PAMI 2015
http://www.micc.unifi.it/masi/code/isr-re-id/ 没有特征提取代码

Person re-identification by Local Maximal Occurrence representation and metric learning CVPR2015
http://www.cbsr.ia.ac.cn/users/scliao/projects/lomo_xqda/

Head detection
Context-aware CNNs for person head detection
Matlab code & dataset avaiable
http://www.di.ens.fr/willow/research/headdetection/

Pedestrian detection

Pedestrian Detection with Spatially Pooled Features and Structured Ensemble Learning PAMI 2015
Strengthening the Effectiveness of Pedestrian Detection with Spatially Pooled Features ECCV2014
https://github.com/chhshen/pedestrian-detection

Is Faster R-CNN Doing Well for Pedestrian Detection
Matlab 代码 :https://github.com/zhangliliang/RPN_BF/tree/RPN-pedestrian

Deep Learning
Deeply Learned Attributes for Crowded Scene Understanding
https://github.com/amandajshao/www_deep_crowd
http://www.ee.cuhk.edu.hk/~jshao/WWWCrowdDataset.html

Quantized Convolutional Neural Networks for Mobile Devices
https://github.com/jiaxiang-wu/quantized-cnn

Human Pose Estimation
DeepPose: Human Pose Estimation via Deep Neural Networks, CVPR2014
https://github.com/mitmul/deeppose not official implementation

Articulated Pose Estimation by a Graphical Model with Image Dependent Pairwise Relations NIPS 2014
http://www.stat.ucla.edu/~xianjie.chen/projects/pose_estimation/pose_estimation.html

Learning Human Pose Estimation Features with Convolutional Networks
https://github.com/stencilman/deep_nets_iclr04

Flowing ConvNets for Human Pose Estimation in Videos
http://www.robots.ox.ac.uk/~vgg/software/cnn_heatmap/

杂项
Unsupervised Learning of Visual Representations using Videos 很有前途啊!
https://github.com/xiaolonw/caffe-video_triplet

Learning Deep Representations of Fine-Grained Visual Descriptions
https://github.com/reedscot/cvpr2016

Fast Detection of Curved Edges at Low SNR
http://www.wisdom.weizmann.ac.il/~yehonato/projectPage.html

Unsupervised Processing of Vehicle Appearance for Automatic Understanding in Traffic Surveillance

code: https://medusa.fit.vutbr.cz/traffic/research-topics/fine-grained-vehicle-recognition/unsupervised-processing-of-vehicle-appearance-for-automatic-understanding-in-traffic-surveillance/

Image Retrieval
Learning Compact Binary Descriptors with Unsupervised Deep Neural Networks
https://github.com/kevinlin311tw/cvpr16-deepbit

Deep Supervised Hashing for Fast Image Retrieval
https://github.com/lhmRyan/deep-supervised-hashing-DSH

Bit-Scalable Deep Hashing with Regularized Similarity Learning for Image Retrieval and Person Re-identification
https://github.com/ruixuejianfei/BitScalableDeepHash

数据库
MPII Human Pose Dataset  http://human-pose.mpi-inf.mpg.de/#overview

WIDER FACE: A Face Detection Benchmark 数据库 http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/

DPM
将voc-release4.0.1 linux 转到windows
http://blog.csdn.net/masibuaa/article/details/17577195

开源车牌识别代码
支持美国和欧洲车牌
http://www.openalpr.com

文字识别
https://github.com/MichalBusta/FASText
FASText: Efficient Unconstrained Scene Text Detector

模板匹配
FAsT-Match: Fast Affine Template Matching
Best-Buddies Similarity for Robust Template Matching
siftdemoV4

 

机器视觉开源处理库:

通用库/General Library

图像,视频IO/Image, Video IO

AR相关/Augmented Reality

基于Marker的AR库

  • ARToolKitPlus   ARToolKit的增强版。实现了更好的姿态估计算法。
  • PTAM   实时的跟踪、SLAM、AR库。无需Marker,模板,内置传感器等。
  • BazAR   基于特征点检测和识别的AR库。

局部不变特征/Local Invariant Feature

  • VLFeat   目前最好的Sift开源实现。同时包含了KD-tree,KD-Forest,BoW实现。
  • Ferns   基于Naive Bayesian Bundle的特征点识别。高速,但占用内存高。

目标检测/Object Detection

(近似)最近邻/ANN

  • FLANN    目前最完整的(近似)最近邻开源库。不但实现了一系列查找算法,还包含了一种自动选取最快算法的机制。
  • ANN   另外一个近似最近邻库。

SLAM & SFM

  • SceneLib [LGPL]   monoSLAM库。由Androw Davison开发。

图像分割/Segmentation

  • SLIC Super Pixel   使用Simple Linear Iterative Clustering产生指定数目,近似均匀分布的Super Pixel。

目标跟踪/Tracking

  • TLD   基于Online Random Forest的目标跟踪算法。
  • KLT   Kanade-Lucas-Tracker

直线检测/Line Detection

  • DSCC   基于联通域连接的直线检测算法。
  • LSD [GPL]  基于梯度的,局部直线段检测算子。

指纹/Finger Print

  • pHash [GPL]   基于感知的多媒体文件Hash算法。(提取,对比图像、视频、音频的指纹)

视觉显著性/Visual Salience

FFT/DWT

  • FFTW [GPL]   最快,最好的开源FFT。
  • FFTReal [WTFPL]   轻量级的FFT实现。许可证是亮点。

音频处理/Audio processing

  • STK [Free]  音频处理,音频合成。
  • libsamplerate [GPL ]   音频重采样。小波变换快速小波变换(FWT)

BRIEF: Binary Robust Independent Elementary Feature 一个很好的局部特征描述子,里面有FAST corner + BRIEF实现特征点匹配的DEMO:http://cvlab.epfl.ch/software/brief/http://code.google.com/p/javacv
Java打包的OpenCV, FFmpeg, libdc1394, PGR FlyCapture, OpenKinect, videoInput, and ARToolKitPlus库。可以放在Android上用~libHIK,HIK SVM,计算HIK SVM跟Centrist的Lib。http://c2inet.sce.ntu.edu.sg/Jianxin/projects/libHIK/libHIK.htm一组视觉显著性检测代码的链接:http://cg.cs.tsinghua.edu.cn/people/~cmm/saliency/

春晚540个机器人资料及其点评

周涛阅读(1137)评论(0)

这几年的央视春晚且不说节目质量如何,对高科技的运用是越发纯熟和先进了,而今年最抢眼的莫过于在广州分会场,540个智能机器人组成小方阵,伴随着《冲向巅峰》的歌声大秀舞技。
“大家新年好!”在除夕夜央视春晚广州分会场上,一个小机器人向全国观众问好,甚至还客串起主持人。随后540个机器人集体为孙楠当起了伴舞,舞姿整齐划一,场面相当震撼。“广东智造”让全国人民啧啧称叹。
这批机器人名为Alpha1S,由广东自主研发,属于双足的仿人形机器人,来自优必选科技有限公司,伺服舵机采用自主改进的PID算法,扭矩大,体积小,控制精度高,运算快,而价格相比日韩不到其三分之一。这款机器人拥有3D可视化动作编辑软件,能够实现仿真模拟、人机互动;同时支持手机APP控制,自动升级演示程序;也支持蓝牙以及拥有人性化外形设计等特性。真可谓是一款唱得了歌、跳得了舞、打得了拳击、练得了功夫的“真心英雄”。据相关人员介绍,表演当晚,540个机器人排成9×15的4个方阵,为了让每个方阵的机器人能够有3套不同的动作以追求更佳的舞台效果,技术人员共为其定制了12套舞步。“舞蹈先后修改了五六版,写了将近70套舞蹈编程,才选出最后这12套。”项目负责人李超说,这套节目代表了机器人科技的世界水平,从设计、编程、到制造,完全国产化,属于智能人形机器人领域的世界最高水平。
此外,广州分会场还动用了29台无人机,承担航拍,在孙楠演唱的时候还整齐划一地升起,在小蛮腰四周璀璨灯光的衬托下,烘托出广州分会场浓郁的“未来时代”气息。


资料:
身高为418mm,宽度198mm,厚109mm,体重1.5kg,骨骼主要由铝合金组成,外壳采用ABS工程塑料,全身上下提供16个可以自由活动的“关节”,其中每条腿有5个,每只胳膊有3个,在没有接通电源的时候,ALPHA1S每个“关节”都没有“力气”,完全站在不住,我们可摆弄他做各种动作。据官方资料显示,ALPHA1S的伺服舵机采用自主改进的PID算法,扭矩大,体积小,控制精度高,运算快,而价格相比日韩不到其三分之一。
在控制部分,ALPHA1S主要依赖于蓝牙模块,利用手机蓝牙与之相连,使用APP下达各种指令,同时也可通过语音控制,但需要注意的是,语音控制目前只有手机版本的APP有,PAD版没有这项功能。
ALPHA1S的大脑来自意法半导体型号为STM32-F103RDT6的MCU,集成32位ARMCortex-M3CPU,最高工作频率72MHz,计算能力达到1.25DMIPS/MHz,具有12通道DMA控制器,3个12位1us级A/D转换器(16通道),2通道12位D/A转换器,51个的快速I/O端口,11个定时器,13个通信接口,片上资源非常丰富,运算能力比较强,这让ALPHA1S变得更加聪明。
ALPHA1S除了拥有一颗聪明的脑袋以外,它的脑容量也不小,最大支持32GB外扩存储卡,随机标配128MBmicroSD卡,ALPHA1S所有的动作、音乐文件都存在个卡里面。同时内置7.4v1500mAH锂电池,每次充满电可以玩50分钟左右。

犀利点评:
1、来源作者:冷哲
这些机器人都是通过所谓“舵机”(一种廉价小型伺服电机)来控制各个关节。关节姿态角的控制是闭环控制的,机器人本身的姿态控制是开环的。
基本上应该是预先设定好整个舞蹈程序,每个舵机按时间顺序向不同的角度移动。整个舞蹈程序以无线触发方式启动,这样所有机器人可以在同一时刻启动整个舞蹈程序。
除了无线触发以外,其余部分的技术都是市面上中高端玩具已经使用的技术。无线触发本身的难度也不是很大,主要是几百个机器人的触发和开环控制需要一些调试的时间。
至于说“时钟同步、通讯协议”之类,其实一概不需要。这种舵机本身的特性以及工作的方式决定了,只要产品一致性较好、一同触发且所有机器人系统时钟频率一致,各机的动作就不会有显著的先后差异。
另外,那个机器人是3000块的优必选出品的Alpha 1S,不是一万欧元的Alderbaran出品的NAO。

2、来源作者::姚盛硕
1.机械方面。舵机是有转动惯量的,这个随着带载会放大,动作的设计也会影响,连续的动作越多,分析也就越复杂。特别是手臂,腿部振动的动作,铁板桥的动作再回来。能够做到540个机体×几十个舵机×歌曲时间=分毫不差。这个问题可以展开讨论一下。
2.集群控制。一般wifi路由上限是255个,540个的话起码用三个。如果是其它通讯方式,比如基站或者干脆触发信号广播相对容易一些。且不说“笨”机器人,540个人排仪仗队也不是个简单事情。BTW三军仪仗队最大151人规模。回想一下军训吧,骚年。
3.EMC方面。这个算是隐藏问题。一般电气设备里,电机是属于干扰比较严重的器件。几千的电机同时工作,那个电磁干扰是怎样的?可以想想看怎么解决。
4.节操问题。有人提到这家公司背景之类的问题。我想说,如果谈这个问题,可以另外开个问题,尽情撕逼。然而讨论技术本身。如果认同快播的“技术无罪论”,我希望还是理性一些比较好。

3、来源作者:匿名用户
好多人都在喷今年春晚的这块款器人,其实论技术的话,技术含量确实不高,不过看到好多人都在喷这款机器人,我觉得有些人喷的有点过了,人家的舵机是自主研发的数字舵机!这大概就是为什么人家的机器人能上春晚,而你们随随便便就能做的长得差不多的机器人不能上春晚的原因吧。
2012年也有一款机器人上了春晚,那款机器人是从韩国买的minirobot,当时国内还没有实力做出这种完全自主研发的产业化的人形机器人(舵机不是买的哦)。
著作权归作者所有。
许多高校本科生都是有能力做出来这种人形机器人的,设计制作周期并不会很长,不过高校本科生做的的人形机器人大多数有以下两个问题:一方面产品外观不是很好,不像nao跟优必选那样,都有封装(这个外壳其实不难做,不过要做基本上就都得开模,只有产业化才可以,产业化跟大家做单件是不一样的,不要以为做出来单件就等于可以做产业化了)另一方面,高校本科生做的机器人在舵机方面都是有问题的哦:1)舵机多半是模拟舵机,pwm波控制,并行通信,导致的结果是占用Io口很多,机器人背后有好多根线 2)舵机当然大都是买了咯,很少有自主研发的,3)近几年国内高校也有用数字舵机的,串行通信的,总线形式的控制,舵机接口是UART串行口,比pwm波稍微高端一点,不过舵机就大都采用韩国进口的数字舵机AX12,AX18,卖的老贵了,某宝上有卖的,不过很少有正规渠道,导致的结果就是售后就不是很好了,这种数字舵机不是所有的舵机都要单独接到控制器上,而是串行通信,每个舵机都有一个ID,所以不用每个舵机都连到控制器,只要一个串一个,靠近控制器的几个舵机连到控制器就行,所以占用的io口比较少,某宝上大多数自称是数字舵机的其实都是模拟舵机,国产的真正稳定可靠的数字舵机在优必选公司诞生之前是没有的。直到最近两年,优必选公司自主研发出了UBT12系列舵机,这款舵机扭矩12KGcm,工作是比较稳定的,去年我有幸参与到一个本科生机器人团队,用这款数字舵机自主设计过一款基于树莓派的智能人形机器人(有视觉识别,语音识别,都是自己用树莓派做的,硬件也都完全是团队自主研发的,舵机主控是stm32f1),机器人已经做出来有半年了,依旧稳定工作,比模拟舵机可靠多了,我们也是参加robocup,我很荣幸当初能进入这个团队,很多人在喷robocup舞蹈机器人,说参加那个项目的都是简单拼装干体力活,其实我想说我们这个团队在机械、硬件、电子控制、软件方面都是在自主研发,所有的机械零件都是非标的,硬件pcb都是自己设计,电路板都是自己焊的,我觉得我们这个团队在用心做机器人,图像识别跟语音识别是在树莓派里面跑的,技术对本科生而言已经很高端了好吧,其实我是想说只要参赛者肯用心做,肯花精力做高端的,就不会很低端,我们也有在尝试做步态算法,也在不断追求高科技(额,偏题了,轻喷,其实是想说优必选的那款舵机有多给力,那款舵机售价比AX12便宜很多,对国内机器人事业的发展是有非常大的促进作用的)
回正题吧,要问春晚的机器人技术含量,确实可以说机器人没啥技术含量,日本2005年做出一款可以自主骑自行车的人形机器人,网上有视频,神奇的骑自行车机器人!这是11年前国外做的,仅仅是随便举了个例子罢了,所以要探究机器人技术的话多去看看国外的吧,眼界宽了自然就知道技术含金量了,我还是个本科生,就不多评价了。跟国外比,国内机器人行业确实还差很多,不过我们应该要看到国内也不断在进步,优必选跟大疆都是很赞的公司。优必选公司只研发出了12KGCM扭矩的数字舵机,一直没能研发出18KGCM的舵机,这个我还是很是遗憾,希望大家轻喷优必选,他们能做出12KGCM的数字舵机,我觉得对国内机器人事业的发展贡献已经很大了,不要以为自己买了国外进口的电机做了一款很牛逼的机械臂就觉得国内水平很高了,根本无法真正摆脱国外技术限制实现完全自主的产业化。给国内机器人市场多一点支持,未来会越来越好的!

CV视觉网点评:
人形机器人已有产品,如法国Aldebaran Robotics旗下的NAO,软银、阿里巴巴、富士康同时注资的Pepper,本田公司的ASIMO,以及2013年被谷歌收购Boston Dynamics公司生产的大狗机器人,但这些机器人无一例外造价居高不下。当然,研发经费的大量投入使得这些机器人科技含量更高,但高昂的价格却很难商业化。相比这些机器人,阿尔法机器人走了一 条不同的路,舵机研发成功后,大幅降价,快速商业化,在商业化中快速迭代和建立生态。希望周剑建立起中国的世界人形机器人!

基于内容的图像检索引擎(以图搜图)

周涛阅读(697)评论(0)

本文介绍一些基于内容的图像检索技术(Content-Based Image Retrieval,CBIR)的搜索引擎(即以图搜图),这类搜索引擎基本上代表了图像检索和识别的主流技术,其中有些搜索引擎的检索结果融合了多模态 的检索(文本、图片内容、上下文等)。这些图片搜索引擎和APP代表了图像检索和识别技术在业界的各类具有代表性的应用场景:1)海量互联网图片搜 索;2)商品购物搜索;3)移动端的商品或物体搜索。

相似图片搜索

1. TinEye

http://www.tineye.com/

2. Google

http://images.google.com.hk/

3. Baidu (百度识图)

http://stu.baidu.com/

4. Bing

http://www.bing.com/images

5. Sougou (搜狗识图)

http://pic.sogou.com/

6. Yahoo

http://images.search.yahoo.com/

7. Imense

http://imense.com/similarsearch/

8. Macroglossa

http://www.macroglossa.com/disclaimer.html

9. Immenselab

http://www.immenselab.com/

10. Picsearch

http://www.picsearch.com/

商品图像搜索

1. Like (被Google收购)

http://www.google.com/shopping

2. Ebay

http://www.ebay.com/mlt/

3. Amazon

http://www.a9.com/whatwedo/visual-search/

4. 淘淘搜

http://www.taotaosou.com/

5. Shopachu

http://www.shopachu.com

6. Chic Engine

http://www.chicengine.com/

7. Fashionfreax

http://lens.fashionfreax.net/zh/

8. Incogna

http://www.incogna.com/

移动图像搜索和识别

1. Google Goggles

http://www.google.com/mobile/goggles

2. Kooaba

http://www.kooaba.com/en/apps

3. SnapTell (被Amazon收购)

SnapTell for iPhone

4. Pixlinq

http://www.pixlinq.com/home

5. Digimarc Discover

http://www.digimarc.com/discover

6. Picitup

http://www2.picitup.com/

7. Recognize

https://www.recognize.im/

8. LTU Mobile

http://www.ltutech.com/solutions/mobile-visual-search/

9. Fashionfreax

http://lens.fashionfreax.net/zh/

10. 百度识别(Mobile)

百度搜索APP

11. 腾讯微信

封面搜索

12. ARART

http://arart.info/

More CBIR search engines:  http://en.wikipedia.org/wiki/List_of_CBIR_engines

CBIR experimental systems: http://www.icvpr.com/cbir-systems/

CV视觉网恭祝大家新春快乐!

周涛阅读(613)评论(0)

尊敬的用户:

大家新年好!充满希望的2016年,在此我感谢在过去支持CV视觉网的各位朋们。衷心祝愿大家在新的一年里身体健康、工作顺利、生活幸福!

感谢您对本网站的支持与关注!                                                                                   CV视觉网-周涛

                                          2016年2月9日

旅行,写作,编程 :IT文艺青年的生活态度

周涛阅读(408)评论(0)

59

本文的作者Alex MacCaw

概括起来,今年到目前为止,我所做的事情包括:

    • 花了10个月的时间做世界环游,途经非洲,东南亚,澳洲,中南美洲里的17个国家和地区。这次旅行的主题就是冲浪和摄影。
    • 出席在香港,日本,美国和伦敦举行的会议
    • 启程时给O’Reilly出版公司写了一本书,书名叫做《JavaScript Web Applications
  • 另外写了一本关于CoffeeScript的书,很快就会由O’Reilly公司出版。
  • 写了大量的开源库,例如Spine, Spine.Mobile, GFX, 和 Juggernaut.
  • 筹划了一个创业公司的框架
  • 出席伦敦2011FOWA会议
  • 最后,我在Twitter公司找到了一份工作

  那么,让我从一年前开始,那是2010年9月,我刚好从一个我合作创办的公司里出来,尽管这段经历是很有价值的,但无休无止的长时间苦干让我精 疲力尽。我回到了英格兰,需要对未来做一些思考。我一直有一个梦想——移居美国(几年就好),所以,我在Google记事本上写了下面的话:

人生的选择:
  去纽约哥伦比亚大学深造
    坏处 - 非常昂贵,并不一定能学到什么真正有用的东西,无聊?
    好处 - 那是一个纽约的大学!
  写一本书,申请 01 签证
    坏处 - 需要大量的时间,有风险
    好处 - 对事业有好处,有趣
  等待。去纽约度一次假(3个月)。等待创业签证。
    很容易 - 不是那么有趣

也许选第二个,不行就选3?

  最终我选择了2,我已经对JavaScript web应用研究了很久,我要写一本这方面的书,为什么不边做环游世界的旅行、边写书呢?这也是我一个梦想呀。我从oneworld买了一份环游世界的机票(比你们想象的要便宜),决定下周去我的第一站,南非。

  如果你从来没有到过非洲,你应该去一次。那里的景色原始而美丽,对那些没有体验过这种景色的人,你很难用言语描绘明白。几年前我就喜欢上了南 方,那时我在东海岸做了一个为期3个月的冲浪旅行。这次,我只有一个月的时间,穿越特兰斯凯,从开普敦到德班。当我在南非旅行时,我的写作也开始了,把早 期向O’Reilly提交的书的框架里的数章填充了材料。

  特兰斯凯是南非非常具有乡野特色的地方,到处是连绵的小山,一些小村庄和土堆的茅屋。他们仍然沿袭着酋长制度,有一个首领,大多数的当地人靠捕 鱼为生。我们在高低不平的土路上颠了两天才到达我心仪的地方,一个美丽的海湾,叫做咖啡湾(Coffee Bay)。在那里,我休整了一下,从网上下载了一些相关资料,为更远的海湾远征做准备。

  我还清晰的记得我们走了数里地来到那个未开垦的海滩,我们从那些一个个被黄沙和小丘孤立的村庄穿行而过。有一个地方,我们要过一条大河,我们需 要游过去,我把背包举过头顶,以免里面的相机和iPod遇到水。非洲是一个让你脱离尘世的地方,解放你的思想,重新认识人生最重要的东西是什么。

  下一站是香港,在那里,我度过了我的21岁生日,接着,我从陆路由新加坡到越南河内。很多人不相信香港70%的面积由自然公园覆盖,我徒步走了几条精彩的景观路线,非常的精彩壮观,比如:香港龙脊。有几天,我在boot.hk这个网站上闲逛,这是一个协作工作的网站,我顺便教了一个同行的游客如何使用ruby。然后,到了夜里,我跟Soho里的一些冲浪爱好者狂欢到凌晨。

  从泰国到柬埔寨到越南是我这次旅行中做喜欢的部分,如果你从没有到过亚洲,你绝对应该去一次。这些国家非常的漂亮,气候非常的好,食物美味可口,人们非常友善。吴哥窟是世上最神奇的地方之一,每个人都应该去看看。是Trey Ratcliff的照片把我吸引到了那里,我的很多其它旅游目的地也是受了他的影响。那个家伙是很多旅游地的第一宣传者。

  在一些无名的小博客中,我听有人说过一个很远的美丽的小岛,在柬埔寨的海边。说小岛的Sihanoukville这个地方有个酒吧,说只能坐小 渔船到那里。我,还有几个非常好的朋友,乘坐晚上的大巴,开始寻找这个传说中的酒吧。搜索差不多进行了一整天,每一个问过的酒吧都把我们指向另外一个酒 吧。最终,我们问了出来,并在第二天早晨做短程巴士去了那个地方。

  上面的照片上是海岸边一个10美元一晚的小木屋。从当地居民区离开后,我们的队伍像小岛上唯一的人,我们随性自由的奔跑。白天我们懒懒的躺在海滩上,吃着岛上厨师准备的鲜美可口的水果沙拉,在夜晚,我们在到处是浮游生物的海里游泳。

  下一站是越南,我们沿着湄公河支流来到一个边界上的小镇,我们是这里唯一的西方人,交流成了最大的问题。幸运的是,我们发现一个也许是镇上唯一会说英语的人,他骑车当我们的向导。当我的信用卡被那里的一个自动取款机吞掉了后,他提供了我很大的帮助!

  我们的队伍分成了几路,在我到达越南时,我的书正在按计划完成,进行的非常顺利。此时,我在西贡多待了几周,让我在书的好几章上有了重大的进展,正好是中国旧历新年,气氛非常的壮观热闹。

  接着是日本,澳大利亚,新西兰和夏威夷。我很难把我所有的感受都在这篇文章里写出来,但说这是此生难忘的一段历程是不为过的。把如此多的美景都 放到一个国家里,太让人赞叹了,我说的正是新西兰。我最喜爱的一段记忆是沿着Wanaka的一个湖边在阳光下跑步,还有就是背着食物和生活用品,徒步数天 穿越Routeburn的大山。在这个国家的旅途中,我结识了好几个值得一生相伴的好友。这是一个真正的天堂。

  就在我环绕新西兰的南部岛屿时,我的书终于完成了,提交给了技术编辑校对。

  接下来是纽约和旧金山,这两个神奇的地方到处是天才的程序员,有些人我很幸运的认识。Techcrunch Disrupt办的很精彩(我高度推荐hackathon)。

  在从纽约到旧金山的中途停留期间,我在各种公司了进行了不少的求职面试,最终在Twitter公司找到了一份做前端开发的工作。要在那里和杰出的团队一起工作,我不能不高兴的颤抖,而去旧金山,同样也是我此生的一个梦想。

  当签证的事办下来了后,我去了中、南美洲旅行,同时开发了我的一个小工程:一个JavaScript MVC框架库,叫做Spine。我到了哥斯达黎加,巴拿马,秘鲁,Bolvia,和阿根廷。 秘鲁是我的最爱,尽管那里的海拔给我带来了不少麻烦,我大部分的时间都在探险。下面的图片是哥斯达黎加传说中神奇猎鹰,是在我爬下世界最深的峡谷时拍到的。

  当我在哥斯达黎加时,微博上有个叫Roberto的家伙给我发了条信息,说他读了我的书,问我是否有兴趣一起冲浪。我欣然同意,坐上去圣何塞的 汽车,在几天后和他会了面。那天我们一起在他海边的公寓里开发Spine和Ruby项目,使用移动硬盘,用汽车电源给笔记本充电。当电量不足后,让太阳能 板补充能量,我们去冲浪。

  我推荐大家去写一本书,特别是边旅游边写书。可以想象,如果我不去旧金山去看一看,我可能还在旅途中,做顾问,去创业。当作家并不能让你直接的 挣到很多钱,但它绝对能提升你的身份地位,给你带来很多潜在的机会。事实上,写作过程让我真正享受的是,我可以认真深入的研究一个题目。

  这一年是我这辈子目前为止最好的一年,而我感觉今后的一年会更好。当我如今定居下来后,我并没有感觉旅行对我的吸引力减少了;我始终把签证放到一个口袋里,而另一个口袋里装着钱包,当召唤降临,随时准备离开。

  可是,这篇文章并不是关于我的旅行,它是要发送一个信号:

  对于程序员来说,有个得天独厚的条件,就是这种职业可以远程工作或边旅游边工作,这是其它职业办不到的。当然,也不都是这样,在我的旅途中,我 没有碰到第二个跟我的做法相似的程序员。这种情况让人悲哀。我想向程序员们送出的信息是,不要再找借口了,行动起来,你可以做到。一个人只有一生,我可以 向你保证,这样的生活才不枉世间走这一遭。

  就像我,我感到极度的幸运,能这样的生活,去发现我的热情所在,去做每天我喜欢做的事情。你可以看出,大部分我现在的境遇并非偶然或侥幸,这是计划,追求,工作的结果。

一份汗水,一份收成。

  这篇文章的目标不是做一些自我陶醉似的炫耀和大话,而是向大家演示如何立下目标,鼓励大家去做相似的事情。想清楚你现在的处境,这一年内你想得到什么,制定出一系列具体的能让你到达这些目标的步骤。追随你的梦想。

[英文原文:Traveling, Writing and Programming ]

怎么读外文文献总结

周涛阅读(755)评论(0)

一.如何进行文献检索

对于自然科学来讲英文文献检索首推Elsevier,Springer等。有时还会碰到查不到的文献,而这些文献的数据库我们所在大学又没有买,怎么办?我基本通过以下向个途径来得到文献。
1、首先在Google 学术搜索里进行搜索,在Google学术搜索里通常情况会出现“每组几个”等字样,然后进入后,分别点击,里面的其中一个就有可能会下到全文,当然这只是碰运气。同时,Google学术搜索中会显示出你搜索文章的引用次数,不过这个引用次数不准确,但是从侧面反应了这篇文章的质量,经典文章的引用次数绝对很高的。同时如果你用作者进行搜索时,会按引用次数出现他写的全部的文章,就可以知道作者的哪些文章比较经典,在没有太多时间的情况下,就可以只看经典的.
2、如果上面的方法找不到全文,就把文章作者的名字或者文章的title在Google 里搜索(不是Google 学术搜索),用作者的名字来搜索,是因为很多国外作者都喜欢把文章的全文(PDF)直接挂在网上,一般情况下他们会把自己的文章挂在自己的个人主页上,这样可能为了让别的研究者更加了解自己的学术领域,顺便推销自己吧。如果文献是由多个作者写的,第一作者查不到个人主页,就接上面的方法查第二作者,以此类推。用文章的title来搜索,是因为在国外有的网站上,例如有的国外大学的图书馆可能会把本校近几年的学术成果的论文PDF全文挂在网上,或者在这个大学的ftp上也有可能会有这样类似的全文。这样就很可能会免费下到你想要的全文了.
3、如果上面两个方法都没有查到你要的文献,那你就直接写邮件向作者要。一般情况下作者都喜欢把自己的文献给别人。下面是本人向老外作者要文献的一个常用的模板:
Dear Professor ×××
I am in ××× Institute of ×××, Chinese Academy of Sciences. I am writing to request your assistance. I search one of your papers:
。。。。。。。。。。。。。。。。。(你的文献题目)
but I can not read full-text content, would you mind sending your papers by E-mail? Thank you for your assistance.
Best wishes !
×××
本人的经验是讲英语的国家的作者给文章的机率会大,一般你要就会给,其它不讲英语的国家,如德国,法国,日本等国家的作者可能不会给。出于礼貌,如果你要的文献作者E-mail给你了,千万别忘记回信致谢.
4.最后一种方法其实大家都熟悉,就是发贴在小木虫上求助。

我还用另一种方法,就是图书馆文献传递。不过有的文献可能是要钱的。

二.如何快速而准确地获得最新的科研信息.
如何快速准确地从浩如烟海的信息海洋中获取所需的信息,并学会分析、利用信息资源已经成为人们立足于信息社会的一个重要技能。我们要时时刻刻了解最新的科研成果,最主要的途径还是要了解最新的科研文献。但是大家有没有发现,国外的数据库有个很好的服务功能就是如果你在其数据库的网站上注册了邮箱,数据库就会自动在每期有新的文章出来时把文章的内容及链接发到你的邮箱里,直接通知你。这样就对我们获取到最新的信息提供了方便.以Elsevier为例,在数据库网站上有”Alerts”点点击进入,要求你输入”User Name”和”Password”,这是对已经注册了邮箱的人进行的.如果你还没有注册,同样会看到右边有一行英语”If not, Register Now. It’s FREE and allows you to”这时点击右边的”Register Now”,就可以进入进行注册,选择你要求的期刊以及你所研究的领域等等,当然还要填好你接受邮件的邮箱,注册成功后,以后就可以收到最新的文献了。几乎所有的外文数据库都有”Email-Alert”这一功能.
三.如何进行文献阅读
其实做科研,不看文献要做好科研,可以说一点可能都没有。只有广看论文,深入学习,才能厚积薄发,写出响当当的文章出来。读文献一定不要心浮气躁,或者就是想着混个毕业。相反我们要沉下心来,大量阅读文献,在读的过程中有的文献看懂了,但是看不懂的文献也可能会居多。看懂的认真学习借鉴,看不懂的 深入探索,实在不行就暂时放下,过一段时间,随着知识和能力的提高慢慢也就弄明白了一些。即使还是看不懂,但是心里知道有那么回事,为将来的继续深造做了铺垫。另外千万不要只是为看文献而看文献,我们看的目的是为了能为我们自己的科研所用,所以看的过程中一定要和你自己的数据相结合,当看完一篇文献后,要好好总结,如果用自己的数据,又该怎么样解释。还有一些牛刊物上的文章,不但要学习文章里面的知识,还要学习牛人写文章的文风。好的文章肯定会有好的文风,这些都是我们将来写文章要学习的。
另外相信很多搞科研的同行会有个感觉,就是看过的文献,如果只是做做标记,划下划线,还是很容易忘记,过段时间要查询起来也费事。尤其是看过的文献有几百,上千篇时,虽然可以归类整理,但效果还是不好。
我建议大家边看一篇文献时,边打开word文档,边整理文章出彩和重要的部分,然后复制过去,标上文献的标题和作者等相关信息,把每一类文献归为一组。 方法操作简单,将来要查询和反复的时候会有很大帮助,尤其在写文章时,相关文献及其亮点都一目了然。这个方法积累久了,对提升写作和阅读都有很大帮助,除了这样,我还有时把一些很经典的段落或都语句翻译成中文,专门整理在一个本本上,这样不但在以后写文章时直接拿出来看,省事省时间,还能锤炼英汉互译的能力,很有利于以后你和老外交流时的口语表达。

最后,请大家始终记住,我们查文献都是为了科研,千万不要只查不看,费了那么大劲查到了就一定要看完.就算是你大概的看了一下也是有用的.同样对科学问题要辩证的看待,文献上别人的观点也只是一家之言,而且不要迷信权威.

“ 科学本身是人类的一种实践。科学研究是一个思考过程。科学行动则是推行某种思考过程的活动,其目的是为了检验这些思考过程的有效性,进而修正和改善这些思考过程,以期达到最高的认识。像一切科学实践一样,科学的判断力取决于个人的经验、信仰和情绪。 我们中间的许多人,或者说我们全体,在我们的专业经历中,都犯过这样或那样的错误。科学工作者应当有虚怀若谷的精神,敢于摒弃先入之见,敢于摆脱对错误思想感情上的依附.

NO.2
这是一位出国留学博士生的学习体会,放到师生互动栏目里与大家交流、分享。
这是我受网上一篇文章的启发并结合我们专业的特点,写的一点个人体会,希望对大家有所裨益。
要在高起点上开展学术研究,阅读英文原文是不可或缺的环节。英文文献阅读的重要性不需赘述,国内多数理工科院校的研究已经实现了和国际的接轨,管理和经济学科相对滞后,但是部分团队已经走在前列。
中文文献看多了之后就会发现很多内容似曾相识,英文文献在内容的广度和深度方面更胜一筹。阅读英文文献的目的不是为了论文增加几个参考文献而看上去好看,当然国内有些人是这么做的,更有甚者为了增加英文参考文献而引用二手或者三手文献,在转引过程中漏洞百出。广泛阅读英文文献是提高综合能力及水平,优化知识结构,转换思维方式,拓展研究视野的必由之路,当然最重要的是将国际先进和中国实际相结合。

(1)英文原文读不懂怎么办?
其实我以前也根本没读过原文,也看不懂。这儿有个好办法:找一本中文经典的书籍,仅看某一节你感兴趣或与你相关的内容,然后先找一两篇英文的综述(review)认真阅读一下,不会的单词可用金山词霸查一查,也许你读第一篇文章需要花两天,你过两天再读第2遍时,你也许只要一天;然后你再读第2篇时也许你只要半天!然后你一定会真正发现读英文文献的快感!(引用部分)
我和这位作者有相同的体会,刚开始阅读的时候可能有些困难,当你经过一个时期的训练之后,就会很快进入状态,并且感觉受益良多。

(2)我们需要阅读什么样的文献?
虽然英文文献总体上水平比较高,但并不是所有的文献都值得阅读,阅读文献的前提是能够检索到对你有价值的文献。第一步知道如何检索文献,现在学校的英文数据库平台很多,可以尝试检索和合理利用。当然机器检索不能完全找到和主题相关的文章,需要扩大检索范围,然后认真阅读摘要,筛选和自己工作相关的文献。第二步知道如何确定文章的价值,这和中文文献阅读具有相似之处,首先是重要期刊的文章,其次是著名学者的文章。例如在国家创新体系领域,Lundvall\Freeman\Nalson\OECD\Porter等这些重要的作者和机构的文献是必读的,不仅要精读他们的经典文献,而且要追踪其最新研究成果,包括工作论文、讨论稿等。通过对重要作者的研究和经典文献的阅读能给你打开一扇门,让你进入一个由核心作者、相关作者、主要期刊和主要研究机构形成的学术网络。

(3)阅读英文文献需要持之以恒
英文文献的阅读需要持之以恒。不只是为了写文章或者做项目才去检索和阅读文献,而是需要贯穿于研究生学习的全过程。这是选题和把握前沿领域的重要途径,同时也可以提高自己的英文阅读能力。当然,文献阅读的效果不会在短期内显现出来,不能说读了几篇英文文献就怎么样,但是当你把英文文献作为主要阅读对象时,可能会渐渐发生变化。

有些中文文献存在不足之处,例如,数据可靠性差、观点(判断)不可检验;方法运用存在缺陷;文献综述不全面等。对于多数社会科学而言我们最终还是要研究中国问题,中文文献是入门的基础,国内重要期刊的文章仍然需要有一个全面的了解。

如果平时读得多了,自然会有感觉,找更高级别杂志的文章读。国外著名的科学家一般都有一个习惯,即每周都认真读1-2篇Science, Nature, Cell等高级别文章。这个习惯希望每个人都能保持!而且Science对中国人是免费的!Nature中也有许多内容是免费的,即使没有密码之类,也能得到大量有用的信息呀。临床的同志一定要读读The lancet和新英格兰杂志!这两本简直太经典了!

NO.3
如何阅读外文文献?
本人是学经济的.看了大量的外文文献.开始时也觉得效率低,不是单词不认识,而是看了后面忘了前面.后来摸索出了一些方法,和大家共享.
三步骤:
首先,通读各个小标题.通常英文文献都很长.拿来文献,先把各个小标题串一串.弄清楚内在的联系.
其次,跳进去读各个小标题内的内容.标注是必不可少的,就是在必要的段落标示出作者的观点.这是为了第三步做准备.
最后,跳出来,再把全文串一遍.根据做好的标示做好阅读摘要.
这样就完成了.

【转帖:读外文文献的一点体会】
PS:一直不会看外文文献,学学人家。
本人英语基础不好,没过六级,所以在硕士的时候基本上看的外文文献很少,现在想想很后悔,2年的时间少学了很多东西。上了博士,自己给自己的定位也高一些了,开始打算硬着头皮咬着牙很不情愿的也要多看些外文文献,一开始看比较慢,有些很难理解,到现在大约仔细阅读了100篇外文文献,泛读了100篇外文文章,受益匪浅,现在基本不怎么看中文的了,确实也觉得外文的质量就是高(也有凑数的烂文章),现在自己写外文的也很顺手了。谈几点自己的体会。
1.先找5篇跟自己论文最相关的外文文章,花一个月的时间认认真真的看,反复看,要求全部读懂,不懂的地方可以和同学和老师交流一下。一个月以后你已经上路了。
2.如何读标题:不要忽视一篇论文的标题,看完标题以后想想要是让你写你怎么用一句话来表达这个标题,根据标题推测一下作者论文可能是什么内容。有时候一句比较长的标题让你写,你可能还不会表达。下次你写的时候就可以借鉴了
3.如何读摘要:快速浏览一遍,这里主要介绍这篇文章做了些什么。也许初看起来不好理解,看不懂,这时候不要气馁,不管它往下看,等你看完这篇文章的时候也许你都明白了。因为摘要写的很简洁,省略了很多前提和条件,在你第一眼看到摘要而不明白作者意图的时候看不懂是正常的。
4.如何读引言(前言):当你了解了你的研究领域的一些情况,看引言应该是一件很容易的事情了,都是介绍性的东西,写的应该都差不多,所以看文献多了以后看这部分的内容就很快了,一扫而过。有些老外写得很经典得句子要记下了,下次你写就可以用了。
5.如何读材料及试验:当你文献看多了以后,这部分内容也很简单了,无非就是介绍试验方法,自己怎么做试验的。很快就能把它看完了吧
6.如何看试验结果:看结果这部分一定要结合结果中的图和表看,这样看的快。主要看懂试验的结果,体会作者的表达方法(例如作者用不同的句子结构描述一些数字的结果)。有时看完以后再想想:就这么一点结果,别人居然可以大篇幅的写这么多,要是我可能半页就说完了?
7.如何看分析与讨论:这是一篇文章的重点,也是最花时间的。我一般把前面部分看完以后不急于看分析讨论。我会想要是我做出来这些结果我会怎么来写这部分分析与讨论呢?然后慢慢看作者的分析与讨论,仔细体会作者观点,为我所用。当然有时候别人的观点比较新,分析比较深刻,偶尔看不懂也是情理之中。当你看的多了,你肯定会看的越来越懂,自己的idea越来越多
8.如何看结论:这个时候看结论就一目了然了,作后再反过去看看摘要,其实差不多
9.把下载的论文打印出来,根据与自己课题的相关性分三类,一类要精读,二类要泛读,三类要选择性的读。分别装订在一起
10.看完的文献千万不要丢在一边不管,3-4个月一定要温习一遍,可以根据需要,对比自己的试验结果来看
11.学会记笔记,重要的结论,经典的句子,精巧的试验方案一定要记下来,供参考和学习
12.有些试验方法相同,结论不同的文献,可以批判性的阅读。我想要是你自己做试验多的话,你应该有这个能力判断谁的更对一点。出现试验方法相同,结论不同的原因有下:试验方法描述不详细,可能方法有差别;试验条件不一样;某些作者夸大结果,瞎编数据
13.有时间还是多看点文献吧,最好定个目标:在学术上超过自己的老板。因为老板一般不看文献,他们都是凭经验做事,很多新东西他们都不知道,慢慢的你老板会觉得你很厉害。
反正我觉得多读了,读起来就快了,而且也会慢慢喜欢上看外文文献,收获自然也就多了。
可能写得有点乱,凑合看吧,我们一起奋斗!!!

NO.5
abuck曰:
1、论文主要解决的问题是什么?
2、这个问题重要吗?为什么?
我为什么要读这篇文献?
是否有人做过?
自己会怎么设计方法来解决?
3、A 通过图表,你会得到什么结论?
B 图表说明什么问题?能否说明该问题
自己要得到这张图会用什么方法?
作者用的是什么方法?
C你能够重新画出这张图,用自己的语言表达吗?
4、作者采用什么方法来解决这个问题?假设是什么?理论依据是什么?
这些方法是否符合论证命题的需要?
通过这个方法,你觉得大概能得到怎样的结果?
是否有能得到更好结果的方法或更加简单的方法?
他为什么这样设计试验?是怎么想到的?有什么创新?你为什么没有想到?
5、A这些设计能否满足需要?为什么?这种方法有什么缺陷或进一步需要阐明的地方? 结 果分析统计方法有什么缺陷
B这些试验是如何组织起来的,之间的逻辑关系是什么?每项试验都有什么意义?哪些是 必要的?哪些是不必要的?
C如果是我得到这样的结果,我会得到什么结论?
6、A 文章的结论是什么?和你想的差异在哪里?
B 结论可靠性如何?对原来的结论有什么支持或变化? 你如何评价?
C 讨论中是如何从已知的知识得到结论的
7、A试验结果是否支持文章的结论 问题、设计、方法和讨论的逻辑关系是什么,作者是如何达到目的的?有哪些哲学思想和技巧?
B 还有哪些不确定采用的是推测的地方?为什么不确定?我能否进一步确定?
C 文章是如何描述结果、如何解析图表趋势,论据如何组合,如何表达自己的观点?
8、和同类文献,有什么共同点和不同点?
9、和以前的文献,作者思路上有什么变化,下一步是什么?我能否有进一步改进或者加入?
10、别人还有哪些地方没做?要是我接着此方向继续做,哪些是在我所在工作条件下可以做的,哪些必须要做,哪些别人肯定比我做得更好更快?
看introduction 回答问题1和2
看图片 回答问题3A
看结论和abstract 回答6A
再看图片 回答3B和3C
图片和结论相结合 回答6B和6C
阅读abstract和结果 回答问题4、5A和5C
比较结果和结论 回答7
比较以前的文献 回答6B和9
比较同类文献 回答8
回答7B和10
最后全部问题过一遍