birdnet-team
diff --git a/‎birdnet_analyzer/cli.py‎
Lines changed: 22 additions & 0 deletions b/‎birdnet_analyzer/cli.py‎
Lines changed: 22 additions & 0 deletions
diff --git a/‎birdnet_analyzer/config.py‎
Lines changed: 9 additions & 0 deletions b/‎birdnet_analyzer/config.py‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎birdnet_analyzer/gui/segments.py‎
Lines changed: 84 additions & 36 deletions b/‎birdnet_analyzer/gui/segments.py‎
Lines changed: 84 additions & 36 deletions
diff --git a/‎birdnet_analyzer/lang/de.json‎
Lines changed: 12 additions & 2 deletions b/‎birdnet_analyzer/lang/de.json‎
Lines changed: 12 additions & 2 deletions
diff --git a/‎birdnet_analyzer/lang/en.json‎
Lines changed: 11 additions & 1 deletion b/‎birdnet_analyzer/lang/en.json‎
Lines changed: 11 additions & 1 deletion
diff --git a/‎birdnet_analyzer/lang/fi.json‎
Lines changed: 11 additions & 1 deletion b/‎birdnet_analyzer/lang/fi.json‎
Lines changed: 11 additions & 1 deletion
diff --git a/‎birdnet_analyzer/lang/fr.json‎
Lines changed: 11 additions & 1 deletion b/‎birdnet_analyzer/lang/fr.json‎
Lines changed: 11 additions & 1 deletion
diff --git a/‎birdnet_analyzer/lang/id.json‎
Lines changed: 11 additions & 1 deletion b/‎birdnet_analyzer/lang/id.json‎
Lines changed: 11 additions & 1 deletion
@@ -541,6 +541,28 @@ def segments_parser():
         help="Minimum length of extracted segments in seconds. If a segment is shorter than this value, it will be padded with audio from the source file.",
     )
 
+    parser.add_argument(
+        "--max_conf",
+        default=cfg.MAX_CONFIDENCE,
+        type=lambda a: max(0.00001, min(1.0, float(a))),
+        help="Maximum confidence threshold. Values in [0.00001, 1.0].",
+    )
+
+    parser.add_argument(
+        "--collection_mode",
+        default=cfg.SEGMENTS_COLLECTION_MODE,
+        choices=["random", "confidence", "balanced"],
+        help="Collection mode for selecting the segments. Can be 'random' or 'confidence'.",
+    )
+
+    parser.add_argument(
+        "--n_bins",
+        type=lambda a: max(2, int(a)),
+        default=10,
+        help="Number of bins to use for the balanced collection mode",
+    )
+
+
     return parser
 
 
 
@@ -90,6 +90,15 @@
 # probabilities and needs to be adjusted)
 MIN_CONFIDENCE: float = 0.25
 
+# Maximum confidence score for the segments feature.
+MAX_CONFIDENCE: float = 1.0
+
+# How segments are selected from the result files.
+SEGMENTS_COLLECTION_MODE: str = "random"
+
+# Number of bins for the balanced collection mode
+BALANCED_COLLECTION_BINS: int = 10
+
 # Number of consecutive detections for one species to merge into one
 # If set to 1 or 0, no merging will be done
 # If set to None, all detections will be included
 
@@ -16,12 +16,14 @@ def extract_segments_wrapper(entry):
 
 @gu.gui_runtime_error_handler
 def _extract_segments(
-    audio_dir, result_dir, output_dir, min_conf, num_seq, audio_speed, seq_length, threads, progress=gr.Progress()
+    audio_dir, result_dir, output_dir, min_conf, max_conf, num_seq, audio_speed, seq_length, threads, collection_mode, progress=gr.Progress()
 ):
     from birdnet_analyzer.segments.utils import parse_files, parse_folders
 
     gu.validate(audio_dir, loc.localize("validation-no-audio-directory-selected"))
 
+    gu.validate(max_conf > min_conf, loc.localize("validation-max-confidence-lower-than-min-confidence"))
+
     if not result_dir:
         result_dir = audio_dir
 
@@ -43,8 +45,11 @@ def _extract_segments(
     # Set confidence threshold
     cfg.MIN_CONFIDENCE = max(0.01, min(0.99, min_conf))
 
+    # Set maximum confidence threshold
+    cfg.MAX_CONFIDENCE = max(0.01, min(1.0, max_conf))
+
     # Parse file list and make list of segments
-    cfg.FILE_LIST = parse_files(cfg.FILE_LIST, max(1, int(num_seq)))
+    cfg.FILE_LIST = parse_files(cfg.FILE_LIST, max(1, int(num_seq)), collection_mode)
 
     # Audio speed
     cfg.AUDIO_SPEED = max(0.1, 1.0 / (audio_speed * -1)) if audio_speed < 0 else max(1.0, float(audio_speed))
@@ -127,40 +132,73 @@ def select_directory_to_state_and_tb(state_key):
                 show_progress="hidden",
             )
 
-        min_conf_slider = gr.Slider(
-            minimum=0.1,
-            maximum=0.99,
-            step=0.01,
-            value=cfg.MIN_CONFIDENCE,
-            label=loc.localize("segments-tab-min-confidence-slider-label"),
-            info=loc.localize("segments-tab-min-confidence-slider-info"),
-        )
-        num_seq_number = gr.Number(
-            100,
-            label=loc.localize("segments-tab-max-seq-number-label"),
-            info=loc.localize("segments-tab-max-seq-number-info"),
-            minimum=1,
-        )
-        audio_speed_slider = gr.Slider(
-            minimum=-10,
-            maximum=10,
-            value=cfg.AUDIO_SPEED,
-            step=1,
-            label=loc.localize("inference-settings-audio-speed-slider-label"),
-            info=loc.localize("inference-settings-audio-speed-slider-info"),
-        )
-        seq_length_number = gr.Number(
-            cfg.SIG_LENGTH,
-            label=loc.localize("segments-tab-seq-length-number-label"),
-            info=loc.localize("segments-tab-seq-length-number-info"),
-            minimum=0.1,
-        )
-        threads_number = gr.Number(
-            4,
-            label=loc.localize("segments-tab-threads-number-label"),
-            info=loc.localize("segments-tab-threads-number-info"),
-            minimum=1,
-        )
+        with gr.Group():
+            with gr.Row():
+                min_conf_slider = gr.Slider(
+                    minimum=0.1,
+                    maximum=0.99,
+                    step=0.01,
+                    value=cfg.MIN_CONFIDENCE,
+                    label=loc.localize("segments-tab-min-confidence-slider-label"),
+                    info=loc.localize("segments-tab-min-confidence-slider-info"),
+                )
+                max_conf_slider = gr.Slider(
+                    minimum=0.1,
+                    maximum=1.0,
+                    step=0.01,
+                    value=cfg.MAX_CONFIDENCE,
+                    label=loc.localize("segments-tab-max-confidence-slider-label"),
+                    info=loc.localize("segments-tab-max-confidence-slider-info"),
+                )
+
+            with gr.Row():
+                collection_mode_radio = gr.Radio(
+                    choices=[
+                            (loc.localize("segments-tab-collection-mode-radio-option-random"), "random"),
+                            (loc.localize("segments-tab-collection-mode-radio-option-confidence"), "confidence"),
+                            (loc.localize("segments-tab-collection-mode-radio-option-balanced"), "balanced"),
+                        ],
+                    value=cfg.SEGMENTS_COLLECTION_MODE,
+                    label=loc.localize("segments-tab-collection-mode-label"),
+                    info=loc.localize("segments-tab-collection-mode-info"),
+                    interactive=True,
+                )
+
+                num_bins = gr.Number(
+                    cfg.BALANCED_COLLECTION_BINS,
+                    label=loc.localize("segments-tab-n-bins-label"),
+                    info=loc.localize("segments-tab-n-bins-info"),
+                    minimum=2,
+                    step=1,
+                    visible=False,
+                    interactive=True)
+
+            num_seq_number = gr.Number(
+                100,
+                label=loc.localize("segments-tab-max-seq-number-label"),
+                info=loc.localize("segments-tab-max-seq-number-info"),
+                minimum=1,
+            )
+            audio_speed_slider = gr.Slider(
+                minimum=-10,
+                maximum=10,
+                value=cfg.AUDIO_SPEED,
+                step=1,
+                label=loc.localize("inference-settings-audio-speed-slider-label"),
+                info=loc.localize("inference-settings-audio-speed-slider-info"),
+            )
+            seq_length_number = gr.Number(
+                cfg.SIG_LENGTH,
+                label=loc.localize("segments-tab-seq-length-number-label"),
+                info=loc.localize("segments-tab-seq-length-number-info"),
+                minimum=0.1,
+            )
+            threads_number = gr.Number(
+                4,
+                label=loc.localize("segments-tab-threads-number-label"),
+                info=loc.localize("segments-tab-threads-number-info"),
+                minimum=1,
+            )
 
         extract_segments_btn = gr.Button(loc.localize("segments-tab-extract-button-label"), variant="huggingface")
 
@@ -178,14 +216,24 @@ def select_directory_to_state_and_tb(state_key):
                 result_directory_state,
                 output_directory_state,
                 min_conf_slider,
+                max_conf_slider,
                 num_seq_number,
                 audio_speed_slider,
                 seq_length_number,
                 threads_number,
+                collection_mode_radio
             ],
             outputs=result_grid,
         )
 
+        def on_collection_mode_change(collection_mode):
+            return gr.Number(visible=collection_mode == "balanced")
+
+        collection_mode_radio.change(
+            on_collection_mode_change,
+            inputs=collection_mode_radio,
+            outputs=num_bins,
+        )
 
 if __name__ == "__main__":
     gu.open_window(build_segments_tab)
@@ -194,7 +194,16 @@
     "segments-tab-max-seq-number-info": "Maximale Anzahl von zufällig extrahierten Segmenten pro Art.",
     "segments-tab-max-seq-number-label": "Maximale Anzahl von Segmenten",
     "segments-tab-min-confidence-slider-info": "Wählt nur Segmente mit einem Wert über diesem Schwellenwert aus.",
-    "segments-tab-min-confidence-slider-label": "Konfidenz-Schwellenwert",
+    "segments-tab-min-confidence-slider-label": "Minimaler Konfidenz-Schwellenwert",
+    "segments-tab-max-confidence-slider-info": "Wählt nur Segmente mit einem Wert unter diesem Schwellenwert aus.",
+    "segments-tab-max-confidence-slider-label": "Maximaler Konfidenz-Schwellenwert",
+    "segments-tab-collection-mode-label": "Sammelmodus",
+    "segments-tab-collection-mode-info": "Gibt an wie die Segmente aus den Ergebnisdateien ausgewählt werden.",
+    "segments-tab-n-bins-label": "Anzahl der Konfidenz-Behälter",
+    "segments-tab-n-bins-info": "Setzt die Anzahl der Konfidenz-Behälter für den ausgeglichenen Sammelmodus.",
+    "segments-tab-collection-mode-radio-option-random": "zufällig",
+    "segments-tab-collection-mode-radio-option-confidence": "nach Konfidenz",
+    "segments-tab-collection-mode-radio-option-balanced": "ausgeglichen",
     "segments-tab-output-selection-button-label": "Wählen Sie das Ausgabeverzeichnis",
     "segments-tab-output-selection-textbox-placeholder": "Gleich wie das Audioverzeichnis, wenn nicht ausgewählt",
     "segments-tab-result-dataframe-column-execution-header": "Ausführung",
@@ -338,5 +347,6 @@
     "validation-no-valid-frequency": "Bitte geben Sie eine gültige Frequenz an",
     "validation-no-valid-learning-rate": "Bitte geben Sie eine gültige Lernrate an.",
     "validation-non-event-samples-required-in-binary-classification": "Für binäre Klassifikation müssen Hintergrundsamples vorhanden sein.",
-    "validation-only-repeat-upsampling-for-multi-label": "Mit Multi-Label Beispielen kann nur 'wiederholen' als Upsampling-Modus verwendet werden."
+    "validation-only-repeat-upsampling-for-multi-label": "Mit Multi-Label Beispielen kann nur 'wiederholen' als Upsampling-Modus verwendet werden.",
+    "validation-max-confidence-lower-than-min-confidence": "Maximaler Konfidenz-Schwellwert muss größer sein als der minimale Schwellwert."
 }
@@ -195,6 +195,15 @@
     "segments-tab-max-seq-number-label": "Maximum number of segments",
     "segments-tab-min-confidence-slider-info": "Select only segments with a confidence above this threshold.",
     "segments-tab-min-confidence-slider-label": "Minimum confidence",
+    "segments-tab-max-confidence-slider-info": "Select only segments with a confidence below this threshold.",
+    "segments-tab-max-confidence-slider-label": "Maximum confidence",
+    "segments-tab-collection-mode-label": "Collection mode",
+    "segments-tab-collection-mode-info": "Determines how segments are selected from the result files.",
+    "segments-tab-n-bins-label": "Number of confidence bins",
+    "segments-tab-n-bins-info": "Sets the number of confidence bins for the balanced collection mode.",
+    "segments-tab-collection-mode-radio-option-random": "random",
+    "segments-tab-collection-mode-radio-option-confidence": "confidence",
+    "segments-tab-collection-mode-radio-option-balanced": "balanced",
     "segments-tab-output-selection-button-label": "Select output directory",
     "segments-tab-output-selection-textbox-placeholder": "Same as audio directory if not selected",
     "segments-tab-result-dataframe-column-execution-header": "Execution",
@@ -338,5 +347,6 @@
     "validation-no-valid-frequency": "Please enter a valid frequency in",
     "validation-no-valid-learning-rate": "Please enter a valid learning rate.",
     "validation-non-event-samples-required-in-binary-classification": "Non-event samples are required for binary classification",
-    "validation-only-repeat-upsampling-for-multi-label": "Only repeat-upsampling is available for multi-label"
+    "validation-only-repeat-upsampling-for-multi-label": "Only repeat-upsampling is available for multi-label",
+    "validation-max-confidence-lower-than-min-confidence": "Maximum confidence must be greater than minimum confidence"
 }
@@ -195,6 +195,15 @@
     "segments-tab-max-seq-number-label": "Segmenttien enimmäismäärä",
     "segments-tab-min-confidence-slider-info": "Valitse vain segmentit, joiden luotettavuus on tätä raja-arvoa korkeampi.",
     "segments-tab-min-confidence-slider-label": "Vähimmäisluotettavuus",
+    "segments-tab-max-confidence-slider-info": "Valitse vain segmentit, joiden luotettavuus on tätä raja-arvoa alhaisempi.",
+    "segments-tab-max-confidence-slider-label": "Enimmäisluotettavuus",
+    "segments-tab-collection-mode-label": "Keräystila",
+    "segments-tab-collection-mode-info": "Määrittää, miten segmentit valitaan tulostiedostoista.",
+    "segments-tab-n-bins-label": "Luotettavuusluokkien määrä",
+    "segments-tab-n-bins-info": "Asettaa luotettavuusluokkien määrän tasapainotetussa keräystilassa.",
+    "segments-tab-collection-mode-radio-option-random": "satunnainen",
+    "segments-tab-collection-mode-radio-option-confidence": "luotettavuus",
+    "segments-tab-collection-mode-radio-option-balanced": "tasapainotettu",
     "segments-tab-output-selection-button-label": "Valitse tulostehakemisto",
     "segments-tab-output-selection-textbox-placeholder": "Sama kuin äänihakemisto, jos ei valittu",
     "segments-tab-result-dataframe-column-execution-header": "Suoritus",
@@ -338,5 +347,6 @@
     "validation-no-valid-frequency": "Anna kelvollinen taajuus",
     "validation-no-valid-learning-rate": "Anna kelvollinen oppimistahti.",
     "validation-non-event-samples-required-in-binary-classification": "Binääriluokittelussa vaaditaan ei-tapahtuma-näytteitä",
-    "validation-only-repeat-upsampling-for-multi-label": "Moninimiöisessä luokittelussa vain 'toista'-ylösnäytteistys on käytettävissä"
+    "validation-only-repeat-upsampling-for-multi-label": "Moninimiöisessä luokittelussa vain 'toista'-ylösnäytteistys on käytettävissä",
+    "validation-max-confidence-lower-than-min-confidence": "Enimmäisluotettavuuden on oltava suurempi kuin vähimmäisluotettavuus" 
 }
@@ -195,6 +195,15 @@
     "segments-tab-max-seq-number-label": "Nombre maximal de segments",
     "segments-tab-min-confidence-slider-info": "Ne sélectionner que les segments dont la confiance est supérieure à ce seuil.",
     "segments-tab-min-confidence-slider-label": "Confiance minimale",
+    "segments-tab-max-confidence-slider-info": "Ne sélectionner que les segments dont la confiance est inférieure à ce seuil.",
+    "segments-tab-max-confidence-slider-label": "Confiance maximale",
+    "segments-tab-collection-mode-label": "Mode de collecte",
+    "segments-tab-collection-mode-info": "Détermine comment les segments sont sélectionnés à partir des fichiers de résultats.",
+    "segments-tab-n-bins-label": "Nombre de classes de confiance",
+    "segments-tab-n-bins-info": "Définit le nombre de classes de confiance pour le mode de collecte équilibré.",
+    "segments-tab-collection-mode-radio-option-random": "aléatoire",
+    "segments-tab-collection-mode-radio-option-confidence": "confiance",
+    "segments-tab-collection-mode-radio-option-balanced": "équilibré",
     "segments-tab-output-selection-button-label": "Sélectionner le répertoire de sortie",
     "segments-tab-output-selection-textbox-placeholder": "Identique au répertoire audio s'il n'est pas sélectionné",
     "segments-tab-result-dataframe-column-execution-header": "Execution",
@@ -338,5 +347,6 @@
     "validation-no-valid-frequency": "Veuillez saisir une fréquence valide dans",
     "validation-no-valid-learning-rate": "Veuillez saisir un taux d'apprentissage valide.",
     "validation-non-event-samples-required-in-binary-classification": "Des échantillons sans événement sont nécessaires pour la classification binaire.",
-    "validation-only-repeat-upsampling-for-multi-label": "Seul l'échantillonnage ascendant répété est disponible pour les étiquettes multiples."
+    "validation-only-repeat-upsampling-for-multi-label": "Seul l'échantillonnage ascendant répété est disponible pour les étiquettes multiples.",
+    "validation-max-confidence-lower-than-min-confidence": "La confiance maximale doit être supérieure à la confiance minimale"
 }
@@ -195,6 +195,15 @@
     "segments-tab-max-seq-number-label": "Jumlah maksimum segmen",
     "segments-tab-min-confidence-slider-info": "Pilih hanya segmen dengan kepercayaan di atas ambang batas ini.",
     "segments-tab-min-confidence-slider-label": "Kepercayaan minimum",
+    "segments-tab-max-confidence-slider-info": "Pilih hanya segmen dengan kepercayaan di bawah ambang batas ini.",
+    "segments-tab-max-confidence-slider-label": "Kepercayaan maksimum",
+    "segments-tab-collection-mode-label": "Mode koleksi",
+    "segments-tab-collection-mode-info": "Menentukan bagaimana segmen dipilih dari file hasil.",
+    "segments-tab-n-bins-label": "Jumlah bin kepercayaan",
+    "segments-tab-n-bins-info": "Mengatur jumlah bin kepercayaan untuk mode koleksi seimbang.",
+    "segments-tab-collection-mode-radio-option-random": "acak",
+    "segments-tab-collection-mode-radio-option-confidence": "kepercayaan",
+    "segments-tab-collection-mode-radio-option-balanced": "seimbang",
     "segments-tab-output-selection-button-label": "Pilih output direktori",
     "segments-tab-output-selection-textbox-placeholder": "Sama dengan direktori audio jika tidak dipilih",
     "segments-tab-result-dataframe-column-execution-header": "Eksekusi",
@@ -338,5 +347,6 @@
     "validation-no-valid-frequency": "Silakan masukkan frekuensi yang valid dalam",
     "validation-no-valid-learning-rate": "Silakan masukkan laju pembelajaran yang valid.",
     "validation-non-event-samples-required-in-binary-classification": "Sampel non-pertanyaan diperlukan untuk klasifikasi biner",
-    "validation-only-repeat-upsampling-for-multi-label": "Hanya 'repeat-upsampling' yang tersedia untuk 'multi-label'"
+    "validation-only-repeat-upsampling-for-multi-label": "Hanya 'repeat-upsampling' yang tersedia untuk 'multi-label'",
+    "validation-max-confidence-lower-than-min-confidence": "Kepercayaan maksimum harus lebih besar dari kepercayaan minimum"
 }