rcv1sub2

mldr.datasets::get.mldr("rcv1sub2")

Download Download

Select your download

Full dataset

MULAN/MEKA (.arff) MULAN (.xml) LibSVM KEEL mldr

Partitions: select your desired partitioning strategy, validation and format

	Random	Stratified	Iterative stratified
Hold out	MULAN MEKA LibSVM KEEL mldr	MULAN MEKA LibSVM KEEL mldr	MULAN MEKA LibSVM KEEL mldr
2x5-fold cross validation	MULAN MEKA LibSVM KEEL mldr	MULAN MEKA LibSVM KEEL mldr	MULAN MEKA LibSVM KEEL mldr
10-fold cross validation	MULAN MEKA LibSVM KEEL mldr	MULAN MEKA LibSVM KEEL mldr	MULAN MEKA LibSVM KEEL mldr

Summary

Instances	6000
Attributes	47337
Inputs	47236
Labels	101
Labelsets	954
Single labelsets	589
Max frequency	549
Cardinality	2.6342
Density	0.0261
Mean IR	45.5138
SCUMBLE	0.2092
TCS	22.2387

Citation

Lewis, D. D.; Yang, Y.; Rose, T. G.; Li, F. (2004). RCV1: A new benchmark collection for text categorization research. In The Journal of Machine Learning Research, 5(), 361--397.

@article{,
  title="RCV1: A new benchmark collection for text categorization research",
  author="Lewis, D. D. and Yang, Y. and Rose, T. G. and Li, F.",
  journal="The Journal of Machine Learning Research",
  volume="5",
  pages="361--397",
  year="2004"
}

Concurrence plot

In this concurrence plot, sectors represent labels and links between them depict label co-occurrences. SCUMBLE is a measure designed to assess the concurrence among imbalanced labels.

Attributes

all attributes labels

numeric Att1 numeric Att2 numeric Att3 numeric Att4 numeric Att5 numeric Att6 numeric Att7 numeric Att8 numeric Att9 numeric Att10 numeric Att11 numeric Att12 numeric Att13 numeric Att14 numeric Att15 numeric Att16 numeric Att17 numeric Att18 numeric Att19 numeric Att20 numeric Att21 numeric Att22 numeric Att23 numeric Att24 numeric Att25 numeric Att26 numeric Att27 numeric Att28 numeric Att29 numeric Att30 numeric Att31 numeric Att32 numeric Att33 numeric Att34 numeric Att35 numeric Att36 numeric Att37 numeric Att38 numeric Att39 numeric Att40 numeric Att41 numeric Att42 numeric Att43 numeric Att44 numeric Att45 numeric Att46 numeric Att47 numeric Att48 numeric Att49 numeric Att50 numeric Att51 numeric Att52 numeric Att53 numeric Att54 numeric Att55 numeric Att56 numeric Att57 numeric Att58 numeric Att59 numeric Att60 numeric Att61 numeric Att62 numeric Att63 numeric Att64 numeric Att65 numeric Att66 numeric Att67 numeric Att68 numeric Att69 numeric Att70 numeric Att71 numeric Att72 numeric Att73 numeric Att74 numeric Att75 numeric Att76 numeric Att77 numeric Att78 numeric Att79 numeric Att80 numeric Att81 numeric Att82 numeric Att83 numeric Att84 numeric Att85 numeric Att86 numeric Att87 numeric Att88 numeric Att89 numeric Att90 numeric Att91 numeric Att92 numeric Att93 numeric Att94 numeric Att95 numeric Att96 numeric Att97 numeric Att98 numeric Att99 numeric Att100 numeric Att101 numeric Att102 numeric Att103 numeric Att104 numeric Att105 numeric Att106 numeric Att107 numeric Att108 numeric Att109 numeric Att110 numeric Att111 numeric Att112 numeric Att113 numeric Att114 numeric Att115 numeric Att116 numeric Att117 numeric Att118 numeric Att119 numeric Att120 numeric Att121 numeric Att122 numeric Att123 numeric Att124 numeric Att125 numeric Att126 numeric Att127 numeric Att128 numeric Att129 numeric Att130 numeric Att131 numeric Att132 numeric Att133 numeric Att134 numeric Att135 numeric Att136 numeric Att137 numeric Att138 numeric Att139 numeric Att140 numeric Att141 numeric Att142 numeric Att143 numeric Att144 numeric Att145 numeric Att146 numeric Att147 numeric Att148 numeric Att149 numeric Att150 numeric Att151 numeric Att152 numeric Att153 numeric Att154 numeric Att155 numeric Att156 numeric Att157 numeric Att158 numeric Att159 numeric Att160 numeric Att161 numeric Att162 numeric Att163 numeric Att164 numeric Att165 numeric Att166 numeric Att167 numeric Att168 numeric Att169 numeric Att170 numeric Att171 numeric Att172 numeric Att173 numeric Att174 numeric Att175 numeric Att176 numeric Att177 numeric Att178 numeric Att179 numeric Att180 numeric Att181 numeric Att182 numeric Att183 numeric Att184 numeric Att185 numeric Att186 numeric Att187 numeric Att188 numeric Att189 numeric Att190 numeric Att191 numeric Att192 numeric Att193 numeric Att194 numeric Att195 numeric Att196 numeric Att197 numeric Att198 numeric Att199 numeric Att200

(47137 more attributes)

Class1 SCUMBLE 0.4477 Class2 SCUMBLE 0.5321 Class3 SCUMBLE 0.311 Class4 SCUMBLE 0.2674 Class5 SCUMBLE 0.1965 Class6 SCUMBLE 0.1853 Class7 SCUMBLE 0.3201 Class8 SCUMBLE 0.2239 Class9 SCUMBLE 0.7525 Class10 SCUMBLE 0.3491 Class11 SCUMBLE 0.3294 Class12 SCUMBLE 0.4865 Class13 SCUMBLE 0.547 Class14 SCUMBLE 0.7186 Class15 SCUMBLE 0.33 Class16 SCUMBLE 0.289 Class17 SCUMBLE 0.684 Class18 SCUMBLE 0.4854 Class19 SCUMBLE 0.416 Class20 SCUMBLE 0.4984 Class21 SCUMBLE 0.5087 Class22 SCUMBLE 0.2224 Class23 SCUMBLE 0.36 Class24 SCUMBLE 0.3058 Class25 SCUMBLE 0.5623 Class26 SCUMBLE 0.4398 Class27 SCUMBLE 0.4565 Class28 SCUMBLE 0.5359 Class29 SCUMBLE 0.6052 Class30 SCUMBLE 0.5897 Class31 SCUMBLE 0.5286 Class32 SCUMBLE 0.5285 Class33 SCUMBLE 0.2722 Class34 SCUMBLE 0.3323 Class35 SCUMBLE 0.1952 Class36 SCUMBLE 0.3171 Class37 SCUMBLE 0.5959 Class38 SCUMBLE 0.5153 Class39 SCUMBLE 0.5201 Class40 SCUMBLE 0.4791 Class41 SCUMBLE 0.5163 Class42 SCUMBLE 0.3458 Class43 SCUMBLE 0.6724 Class44 SCUMBLE 0.3757 Class45 SCUMBLE 0.2641 Class46 SCUMBLE 0.3419 Class47 SCUMBLE 0.2035 Class48 SCUMBLE 0.3116 Class49 SCUMBLE 0.4497 Class50 SCUMBLE 0.5067 Class51 SCUMBLE 0.7896 Class52 SCUMBLE 0.4445 Class53 SCUMBLE 0.4399 Class54 SCUMBLE 0.4192 Class55 SCUMBLE 0.6673 Class56 SCUMBLE 0.4497 Class57 SCUMBLE 0.4452 Class58 SCUMBLE 0.8879 Class59 SCUMBLE 0.3124 Class60 SCUMBLE 0.3079 Class61 SCUMBLE 0.408 Class62 SCUMBLE 0.3122 Class63 SCUMBLE 0.492 Class64 SCUMBLE 0.7433 Class65 SCUMBLE 0.3675 Class66 SCUMBLE 0.6716 Class67 SCUMBLE 0.7114 Class68 SCUMBLE 0.4915 Class69 SCUMBLE 0.6093 Class70 SCUMBLE 0.8 Class71 SCUMBLE 0.2996 Class72 SCUMBLE 0.2822 Class73 SCUMBLE 0.5109 Class74 SCUMBLE 0.3214 Class75 SCUMBLE 0.5404 Class76 SCUMBLE 0.3094 Class77 SCUMBLE 0.5675 Class78 SCUMBLE 0.3336 Class79 SCUMBLE 0.4277 Class80 SCUMBLE 0.4249 Class81 SCUMBLE 0.8272 Class82 SCUMBLE 0.0441 Class83 SCUMBLE 0.0465 Class84 SCUMBLE 0.2136 Class85 SCUMBLE 0.1409 Class86 SCUMBLE 0.1638 Class87 SCUMBLE 0.0965 Class88 SCUMBLE 0.0783 Class89 SCUMBLE 0.3456 Class90 SCUMBLE 0.3374 Class91 SCUMBLE 0.5741 Class92 SCUMBLE 0.6816 Class93 SCUMBLE 0.6757 Class94 SCUMBLE 0.0357 Class95 SCUMBLE 0.0573 Class96 SCUMBLE 0.091 Class97 SCUMBLE 0.082 Class98 SCUMBLE 0.1016 Class99 SCUMBLE 0.1365 Class100 SCUMBLE 0.123 Class101 SCUMBLE 0.3849

Download this metadata in a machine-friendly format (JSON)