Dienstag, 8. November 2011

Datensets

Solange das FutureSOC Storage System außer Gefecht ist haben wir eine Kopie der Inputdaten bei uns lokal abgelegt:

Testvideo:
http://www.yovisto.com/labs/testdata/mg33.mov (14GB)

Video Infos:
Video Codec: VC-3 (aka Avid DNxHD)

General
Complete name : mg33.mov
Format : MPEG-4
Format profile : QuickTime
Codec ID : qt
File size : 13.6 GiB
Duration : 16mn 2s
Overall bit rate : 121 Mbps
Encoded date : 2007
Writing application : Lavf53.4.0

Video
ID : 1
Format : AVdn
Codec ID : AVdn
Duration : 16mn 2s
Bit rate mode : Constant
Bit rate : 14.1 Mbps
Width : 1 920 pixels
Height : 1 080 pixels
Display aspect ratio : 16:9
Frame rate mode : Constant
Frame rate : 25.000 fps
Bits/(Pixel*Frame) : 0.273
Stream size : 1.58 GiB (12%)
Language : English

Audio
ID : 2
Format : AAC
Format/Info : Advanced Audio Codec
Format version : Version 4
Format profile : LC
Format settings, SBR : No
Codec ID : 40
Duration : 16mn 2s
Bit rate mode : Constant
Bit rate : 121 Kbps
Channel(s) : 2 channels
Channel positions : L R
Sampling rate : 48.0 KHz
Stream size : 13.8 MiB (0%)
Language : English


Bag-of-Words Imageset (PascalVOC2010)
http://www.yovisto.com/labs/testdata/VOCtrainval_03-May-2010.tar (1.3GB)

Bag-of-Words Raw Feature Data
http://www.yovisto.com/labs/testdata/rawImageDescriptors.tar (1.0GB)

ICDAR Text Recognition Data
TrailTrain (258 images, 43.3MB)
TrialTest (251 images, 69.6MB)

ARFF Testdata für Testclassifier
http://www.yovisto.com/labs/testdata/Mahout-Data.zip (39MB)

Kommentare:

  1. Warum ist das erste Video so riesig, wenn die beiden Streams lediglich ~1,6GB groß sind?

    AntwortenLöschen
  2. Willkommen in der digitalen Welt der Videos -- hier ist nichts, wie es scheint und man weiss nie, wem man vertrauen kann.

    Bei der Arbeit mit digitalen Videos kommt man immer wieder in abenteuerliche Situationen, die es zu überstehen gilt.

    Die Vielzahl an Werzeugen, seien es kommerzielle, kostenlose oder open-source Produkte, können mit der hohen Anzahl an unterschiedlichen Video-, Audio Formaten und Codecs und deren Weiterentwicklungen nicht immer mithalten. Häufig passiert es, dass verschiedene Werkzeuge unterschiedliche Angaben manchen, z.B. bzgl. Anzahl der Frames in einem Video, Dauer oder Bitraten einzelner Ströme.

    In diesem Fall haben wir nicht die aktuellste Version 0.7.50 des Werkzeuges 'mediainfo' verwendet, sondern die etwas ältere Version 0.7.27, die gerade eben nicht in der Lage war, die Daten plausibel aus dem Video zu lesen.

    Nichtsdestotrotz ist mediainfo im Dschungel der Tools eines der verlässlichsten Werkzeuge.

    http://mediainfo.sourceforge.net/de/Download


    Hier also nun die neue Ausgabe:


    General
    Complete name : mg33.mov
    Format : MPEG-4
    Format profile : QuickTime
    Codec ID : qt
    File size : 13.6 GiB
    Duration : 16mn 2s
    Overall bit rate mode : Constant
    Overall bit rate : 121 Mbps
    Recorded date : 2007
    Writing application : Lavf53.4.0

    Video
    ID : 1
    Format : VC-3
    Codec ID : AVdn
    Codec ID/Info : Avid
    Codec ID/Hint : DNxHD
    Duration : 16mn 2s
    Bit rate mode : Constant
    Bit rate : 121 Mbps
    Width : 1 920 pixels
    Height : 1 080 pixels
    Display aspect ratio : 16:9
    Frame rate mode : Constant
    Frame rate : 25.000 fps
    Color space : YUV
    Chroma subsampling : 4:2:2
    Bit depth : 8 bits
    Scan type : Progressive
    Bits/(Pixel*Frame) : 2.339
    Stream size : 13.6 GiB (100%)
    Language : English

    Audio
    ID : 2
    Format : AAC
    Format/Info : Advanced Audio Codec
    Format profile : LC
    Codec ID : 40
    Duration : 16mn 2s
    Bit rate mode : Constant
    Bit rate : 121 Kbps
    Channel(s) : 2 channels
    Channel positions : Front: L R
    Sampling rate : 48.0 KHz
    Compression mode : Lossy
    Stream size : 13.8 MiB (0%)
    Language : English

    AntwortenLöschen
  3. Ok, danke - hatte auf einen Fehler in die andere Richtug gehofft :D

    Aber ist denn wirklich eine so hohe Bitrate notwendig?
    13Gb sind doch recht unpraktisch.

    AntwortenLöschen
  4. ... dies ist das kleinste aller Videos, die wir bereit stellen werden. ;-)

    Ziel ist doch, gerade diese großen Videos möglichst schnell zu bearbeiten. In professionellen Wokflows (z.B. in Archiven und Sendeanstalten) wird gerade mit derartigen Videos gearbeitet. Klar ist allerdings auch, dass für den einen oder anderen Analyseschritt das Video auch in einer kleineren Auflösung oder einem Codec mit stärkerer Komprimierung verwendet werden kann (sog. Proxy-Format). Zum Entwickeln von Software, würde ich das Video evtl. auch etwas kleiner machen.

    Dennoch bleibt das Ziel, die Algorithmen basieren auf dieser Art von Video zu parallelisieren und zu optimieren.

    AntwortenLöschen