update notebook for renamed functions

amueller · amueller · commit 75ef17dbdeab · 2016-03-18T14:48:17.000+01:00
diff --git a/examples/OpenMLDemo.ipynb b/examples/OpenMLDemo.ipynb
@@ -118,7 +118,7 @@
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "First 10 of 3335 datasets...\n",
+      "First 10 of 2806 datasets...\n",
       "   did             name  NumberOfInstances  NumberOfFeatures\n",
       "0    1           anneal                898                39\n",
       "1    2           anneal                898                39\n",
@@ -361,7 +361,7 @@
     }
    ],
    "source": [
-    "X, y, attribute_names = dataset.get_dataset(target=dataset.default_target_attribute, return_attribute_names=True)\n",
+    "X, y, attribute_names = dataset.get_data(target=dataset.default_target_attribute, return_attribute_names=True)\n",
     "iris = pd.DataFrame(X, columns=attribute_names)\n",
     "iris['class'] = y\n",
     "print(iris[:10])"
@@ -417,7 +417,7 @@
    ],
    "source": [
     "dataset = openml.datasets.get_dataset(61)\n",
-    "X, y = dataset.get_dataset(target=dataset.default_target_attribute)\n",
+    "X, y = dataset.get_data(target=dataset.default_target_attribute)\n",
     "clf = ensemble.RandomForestClassifier()\n",
     "clf.fit(X, y)"
    ]
@@ -464,7 +464,23 @@
    "metadata": {
     "collapsed": false
    },
-   "outputs": [],
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "RandomForestClassifier(bootstrap=True, class_weight=None, criterion='gini',\n",
+       "            max_depth=None, max_features='auto', max_leaf_nodes=None,\n",
+       "            min_samples_leaf=1, min_samples_split=2,\n",
+       "            min_weight_fraction_leaf=0.0, n_estimators=10, n_jobs=1,\n",
+       "            oob_score=False, random_state=None, verbose=0,\n",
+       "            warm_start=False)"
+      ]
+     },
+     "execution_count": 12,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
    "source": [
     "X_2d = X[:,2:4]\n",
     "clf.fit(X_2d, y)\n",
@@ -502,7 +518,7 @@
     }
    ],
    "source": [
-    "X, y, categorical = dataset.get_dataset(target=dataset.default_target_attribute,return_categorical_indicator=True)\n",
+    "X, y, categorical = dataset.get_data(target=dataset.default_target_attribute,return_categorical_indicator=True)\n",
     "enc = preprocessing.OneHotEncoder(categorical_features=categorical)\n",
     "X = enc.fit_transform(X)\n",
     "clf.fit(X, y)"
@@ -537,16 +553,16 @@
    },
    "outputs": [
     {
-     "ename": "TypeError",
-     "evalue": "int() argument must be a string, a bytes-like object or a number, not 'NoneType'",
-     "output_type": "error",
-     "traceback": [
-      "\u001b[1;31m---------------------------------------------------------------------------\u001b[0m",
-      "\u001b[1;31mTypeError\u001b[0m                                 Traceback (most recent call last)",
-      "\u001b[1;32m<ipython-input-14-7653a7076e49>\u001b[0m in \u001b[0;36m<module>\u001b[1;34m()\u001b[0m\n\u001b[1;32m----> 1\u001b[1;33m \u001b[0mtask_list\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mopenml\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mtasks\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mlist_tasks\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m      2\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m      3\u001b[0m \u001b[0mtasks\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mpd\u001b[0m\u001b[1;33m.\u001b[0m\u001b[0mDataFrame\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mtask_list\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m      4\u001b[0m \u001b[0mprint\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;34m\"First 5 of %s tasks:\"\u001b[0m \u001b[1;33m%\u001b[0m \u001b[0mlen\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mtasks\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m      5\u001b[0m \u001b[0mprint\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mtasks\u001b[0m\u001b[1;33m[\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;36m5\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m[\u001b[0m\u001b[1;33m[\u001b[0m\u001b[1;34m'tid'\u001b[0m\u001b[1;33m,\u001b[0m\u001b[1;34m'did'\u001b[0m\u001b[1;33m,\u001b[0m\u001b[1;34m'name'\u001b[0m\u001b[1;33m,\u001b[0m\u001b[1;34m'task_type'\u001b[0m\u001b[1;33m,\u001b[0m\u001b[1;34m'estimation_procedure'\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
-      "\u001b[1;32m/home/andy/checkout/openml-python/openml/tasks/task_functions.py\u001b[0m in \u001b[0;36mlist_tasks\u001b[1;34m()\u001b[0m\n\u001b[0;32m    136\u001b[0m         \u001b[0mthe\u001b[0m \u001b[0massociated\u001b[0m \u001b[0mdataset\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0msome\u001b[0m \u001b[0mof\u001b[0m \u001b[0mthese\u001b[0m \u001b[0mare\u001b[0m \u001b[0malso\u001b[0m \u001b[0mreturned\u001b[0m\u001b[1;33m.\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    137\u001b[0m     \"\"\"\n\u001b[1;32m--> 138\u001b[1;33m     \u001b[1;32mreturn\u001b[0m \u001b[0m_list_tasks\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;34m'task/list'\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0m\u001b[0;32m    139\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    140\u001b[0m \u001b[1;33m\u001b[0m\u001b[0m\n",
-      "\u001b[1;32m/home/andy/checkout/openml-python/openml/tasks/task_functions.py\u001b[0m in \u001b[0;36m_list_tasks\u001b[1;34m(api_call)\u001b[0m\n\u001b[0;32m    160\u001b[0m     \u001b[0mproc_dict\u001b[0m \u001b[1;33m=\u001b[0m \u001b[0mdict\u001b[0m\u001b[1;33m(\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mx\u001b[0m\u001b[1;33m[\u001b[0m\u001b[1;34m'id'\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m,\u001b[0m \u001b[0mx\u001b[0m\u001b[1;33m)\u001b[0m \u001b[1;32mfor\u001b[0m \u001b[0mx\u001b[0m \u001b[1;32min\u001b[0m \u001b[0mprocs\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    161\u001b[0m     \u001b[1;32mfor\u001b[0m \u001b[0mtask_\u001b[0m \u001b[1;32min\u001b[0m \u001b[0mtasks_dict\u001b[0m\u001b[1;33m[\u001b[0m\u001b[1;34m'oml:tasks'\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m[\u001b[0m\u001b[1;34m'oml:task'\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m:\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[1;32m--> 162\u001b[1;33m         task = {'tid': int(task_['oml:task_id']),\n\u001b[0m\u001b[0;32m    163\u001b[0m                 \u001b[1;34m'did'\u001b[0m\u001b[1;33m:\u001b[0m \u001b[0mint\u001b[0m\u001b[1;33m(\u001b[0m\u001b[0mtask_\u001b[0m\u001b[1;33m[\u001b[0m\u001b[1;34m'oml:did'\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m)\u001b[0m\u001b[1;33m,\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n\u001b[0;32m    164\u001b[0m                 \u001b[1;34m'name'\u001b[0m\u001b[1;33m:\u001b[0m \u001b[0mtask_\u001b[0m\u001b[1;33m[\u001b[0m\u001b[1;34m'oml:name'\u001b[0m\u001b[1;33m]\u001b[0m\u001b[1;33m,\u001b[0m\u001b[1;33m\u001b[0m\u001b[0m\n",
-      "\u001b[1;31mTypeError\u001b[0m: int() argument must be a string, a bytes-like object or a number, not 'NoneType'"
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "First 5 of 8566 tasks:\n",
+      "   tid  did        name                  task_type     estimation_procedure\n",
+      "0    1    1      anneal  Supervised Classification  10-fold Crossvalidation\n",
+      "1    2    2      anneal  Supervised Classification  10-fold Crossvalidation\n",
+      "2    3    3    kr-vs-kp  Supervised Classification  10-fold Crossvalidation\n",
+      "3    4    4       labor  Supervised Classification  10-fold Crossvalidation\n",
+      "4    5    5  arrhythmia  Supervised Classification  10-fold Crossvalidation\n"
      ]
     }
    ],
@@ -644,8 +660,8 @@
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "Uploaded run with id 538163\n",
-      "Check it at www.openml.org/r/538163\n"
+      "Uploaded run with id 538241\n",
+      "Check it at www.openml.org/r/538241\n"
      ]
     }
    ],
@@ -667,24 +683,6 @@
    "source": [
     "More to come soon..."
    ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "collapsed": true
-   },
-   "outputs": [],
-   "source": []
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "collapsed": true
-   },
-   "outputs": [],
-   "source": []
   }
  ],
  "metadata": {