learningequality · rtibbles · Mar 19, 2025 · Mar 26, 2025 · marcellamaki · Jan 17, 2025
diff --git a/kolibri/core/content/api.py b/kolibri/core/content/api.py
@@ -258,12 +258,19 @@ def list(self, request, *args, **kwargs):
         return super(RemoteViewSet, self).list(request, *args, **kwargs)
 
 
+class CharInFilter(BaseInFilter, CharFilter):
+    pass
+
+
 class ChannelMetadataFilter(FilterSet):
     available = BooleanFilter(method="filter_available", label="Available")
     contains_exercise = BooleanFilter(
         method="filter_contains_exercise", label="Has exercises"
     )
     contains_quiz = BooleanFilter(method="filter_contains_quiz", label="Has quizzes")
+    included_languages = CharInFilter(
+        field_name="included_languages", label="Languages", distinct=True
+    )
 
     class Meta:
         model = models.ChannelMetadata
@@ -419,10 +426,6 @@ class UUIDInFilter(BaseInFilter, UUIDFilter):
     pass
 
 
-class CharInFilter(BaseInFilter, CharFilter):
-    pass
-
-
 contentnode_filter_fields = [
     "parent",
     "parent__isnull",
@@ -473,6 +476,7 @@ class ContentNodeFilter(FilterSet):
     keywords = CharFilter(method="filter_keywords")
     channels = UUIDInFilter(field_name="channel_id")
     languages = CharInFilter(field_name="lang_id")
+    included_languages = CharInFilter(field_name="included_languages")
     categories__isnull = BooleanFilter(field_name="categories", lookup_expr="isnull")
     lft__gt = NumberFilter(field_name="lft", lookup_expr="gt")
     rght__lt = NumberFilter(field_name="rght", lookup_expr="lt")
@@ -673,10 +677,11 @@ def get_queryset(self):
         return models.ContentNode.objects.filter(available=True)
 
     def get_related_data_maps(self, items, queryset):
+        ids = [item["id"] for item in items]
         assessmentmetadata_map = {
             a["contentnode"]: a
             for a in models.AssessmentMetaData.objects.filter(
-                contentnode__in=queryset
+                contentnode__in=ids
             ).values(
                 "assessment_item_ids",
                 "number_of_assessments",
@@ -690,7 +695,7 @@ def get_related_data_maps(self, items, queryset):
         files_map = {}
 
         files = list(
-            models.File.objects.filter(contentnode__in=queryset).values(
+            models.File.objects.filter(contentnode__in=ids).values(
                 "id",
                 "contentnode",
                 "local_file__id",
@@ -725,7 +730,7 @@ def get_related_data_maps(self, items, queryset):
         tags_map = {}
 
         for t in (
-            models.ContentTag.objects.filter(tagged_content__in=queryset)
+            models.ContentTag.objects.filter(tagged_content__in=ids)
             .values(
                 "tag_name",
                 "tagged_content",

diff --git a/kolibri/core/content/contentschema/versions/content_schema_current.py b/kolibri/core/content/contentschema/versions/content_schema_current.py
@@ -145,6 +145,22 @@ class ContentContentnodeHasPrerequisite(Base):
     to_contentnode_id = Column(CHAR(32), nullable=False, index=True)
 
 
+class ContentContentnodeIncludedLanguages(Base):
+    __tablename__ = "content_contentnode_included_languages"
+    __table_args__ = (
+        Index(
+            "content_contentnode_included_languages_contentnode_id_language_id_7d14ec8b_uniq",
+            "contentnode_id",
+            "language_id",
+            unique=True,
+        ),
+    )
+
+    id = Column(Integer, primary_key=True)
+    contentnode_id = Column(CHAR(32), nullable=False, index=True)
+    language_id = Column(String(14), nullable=False, index=True)
+
+
 class ContentContentnodeRelated(Base):
     __tablename__ = "content_contentnode_related"
     __table_args__ = (

diff --git a/kolibri/core/content/migrations/0040_contentnode_included_languages.py b/kolibri/core/content/migrations/0040_contentnode_included_languages.py
@@ -0,0 +1,23 @@
+# Generated by Django 3.2.25 on 2024-12-18 00:14
+from django.db import migrations
+from django.db import models
+
+
+class Migration(migrations.Migration):
+
+    dependencies = [
+        ("content", "0039_channelmetadata_ordered_fields"),
+    ]
+
+    operations = [
+        migrations.AddField(
+            model_name="contentnode",
+            name="included_languages",
+            field=models.ManyToManyField(
+                blank=True,
+                related_name="contentnodes",
+                to="content.Language",
+                verbose_name="languages",
+            ),
+        ),
+    ]
diff --git a/kolibri/core/content/models.py b/kolibri/core/content/models.py
@@ -215,6 +215,18 @@ class ContentNode(base_models.ContentNode):
     # needs a subsequent Kolibri upgrade step to backfill these values.
     admin_imported = models.BooleanField(null=True)
 
+    # Languages that are in this node and/or any descendant nodes of this node
+    # for non-topic nodes, this is the language of the node itself
+    # for topic nodes, this is the union of all languages of all descendant nodes
+    # any language directly set on the topic nodes is ignored,
+    # as it is not meaningful to set a language on a topic node if it does not apply
+    # to any descendants.
+    # We do this to allow filtering of a topic tree by a specific language for
+    # multi-language channels.
+    included_languages = models.ManyToManyField(
+        "Language", related_name="contentnodes", verbose_name="languages", blank=True
+    )
+
     objects = ContentNodeManager()
 
     class Meta: